前の記事で、Alder Lake のEコアである Gracemont では SHLD 命令がものすごく遅いせいで ULxx のエンコードが遅いという話をしました。

じゃあってんで SHLD 命令を等価な命令にバラして書いて計測してみたところ、YV24 -> ULY4 の predict left が 13.5fps から 32.4fps に高速化しました。これはこれでいいんですが、Pコアで実行した場合は逆に 56.2fps から 48.7fps に悪化します。遅くなるのは Golden Cove に限った話ではなく、他の Core 系 MA でも 10-15% の低速化になります。

まだいろいろ考えることがあるようです。

Alder Lake を買ったので、Pコア、Eコア、Rocket Lake、Coffee Lake でシングルスレッド時の速度比較をしました。

Read the rest of this entry

その他
  • VCM インターフェースにおいて、ICMODE_QUERY で開いた場合でも Configure と SetState を呼べるようにした。

Read the rest of this entry

11月4日に Alder Lake こと第12世代 Core i シリーズプロセッサが発売されました。

映像コーデックの視点として、 Alder Lake への最適化には以下の2つの要素が考えられます。

Read the rest of this entry

機能追加
  • ULxx: より高い圧縮比が期待されるモードを追加した。

Read the rest of this entry

性能向上
  • ULxx, UQxx: predict gradient および predict left のマルチスレッド時のデコードを高速化した。
  • UMxx: マルチスレッド時のデコードを高速化した。

Read the rest of this entry

性能向上
  • all: AVX512-VBMI2 が使える環境での、内部 YUV444/YUV422 のバリアントの RGB24/32 での入出力を高速化した。

Read the rest of this entry

性能向上
  • UMxx: AVX512-VBMI2 が使える環境でのエンコードを高速化した。
  • UMxx: フレーム間圧縮のデコードを高速化した。
  • all: AVX512-VBMI2 が使える環境での RGB32/RGBA/YUY2/UYVY へのデコードを高速化した。

Read the rest of this entry

性能向上
  • UMxx: AVX512-VBMI2 が使える環境での入出力を高速化した。
その他
  • サポート環境および推奨環境を更新した。

Read the rest of this entry

Rocket Lake, Coffee Lake, Haswell, Sandy Bridge で速度比較をしました。

Read the rest of this entry