性能向上
  • UMxx: AVX512-VBMI2 が使える環境でのエンコードを高速化した。
  • UMxx: フレーム間圧縮のデコードを高速化した。
  • all: AVX512-VBMI2 が使える環境での RGB32/RGBA/YUY2/UYVY へのデコードを高速化した。

Read the rest of this entry

ベンチマークプログラムを書き直したのでちゃんと測ってみました(10日ぐらい前の話ですが)。計測対象は前記事と同じく Rocket Lake です。

Read the rest of this entry

雑にちょっとだけ測っただけなんですが、(Rocket Lake において) AVX-512 のマスクレジスタを使った時のレイテンシの増加は1で固定「ではない」ということが分かりました。

Read the rest of this entry

性能向上
  • UMxx: AVX512-VBMI2 が使える環境での入出力を高速化した。
その他
  • サポート環境および推奨環境を更新した。

Read the rest of this entry

Visual Studio 2019 にはパフォーマンスプロファイラーが付いていて、 CPU プロファイリングとかができるんですが、今やってみたら「選択した時間に実行されたコードはありませんでした」と言われて全くデータが取れません。

Read the rest of this entry

Rocket Lake, Coffee Lake, Haswell, Sandy Bridge で速度比較をしました。

Read the rest of this entry

Hyper-V ゲストで CPU のパフォーマンスカウンタを仮想化する方法は Enable Intel Performance Monitoring Hardware in a Hyper-V virtual machine | Microsoft Docs に書いてあります。

Read the rest of this entry

Rocket Lake は DDR4-3200 を定格動作でサポートしますが、 i9-11900K/KF 以外の SKU では、 DDR4-3200 の場合にメモリコントローラのクロックがメモリのクロックと同じ(これを Gear1 という)ではなく半分(これを Gear2 という)になる、という説明がなされています。 Gear2 だと性能が下がります(下がるはずです)。

Read the rest of this entry

機能追加
  • ベンチマークを開始する前にファイルを全て読み込むオプションを追加した。(-R)
その他
  • Intel SDE の CLFLUSH のバグに対する回避策を追加した。

Read the rest of this entry

我々は3年待ったのだ!

Read the rest of this entry