性能向上
  • all: AVX512-VBMI2 が使える環境での、内部 YUV444/YUV422 のバリアントの RGB24/32 での入出力を高速化した。

Read the rest of this entry

手元の 20.04 に GCC (g++) をインストールしようとしたら、見慣れないエラーが出てきました。

Read the rest of this entry

ちょちょいと高速化しました。

Read the rest of this entry

以前、AVX2 による並列ハフマンデコードを試したことがあって、その時には利点が無いという結論になっていました。

Read the rest of this entry

性能向上
  • UMxx: AVX512-VBMI2 が使える環境でのエンコードを高速化した。
  • UMxx: フレーム間圧縮のデコードを高速化した。
  • all: AVX512-VBMI2 が使える環境での RGB32/RGBA/YUY2/UYVY へのデコードを高速化した。

Read the rest of this entry

ベンチマークプログラムを書き直したのでちゃんと測ってみました(10日ぐらい前の話ですが)。計測対象は前記事と同じく Rocket Lake です。

Read the rest of this entry

雑にちょっとだけ測っただけなんですが、(Rocket Lake において) AVX-512 のマスクレジスタを使った時のレイテンシの増加は1で固定「ではない」ということが分かりました。

Read the rest of this entry

性能向上
  • UMxx: AVX512-VBMI2 が使える環境での入出力を高速化した。
その他
  • サポート環境および推奨環境を更新した。

Read the rest of this entry

Visual Studio 2019 にはパフォーマンスプロファイラーが付いていて、 CPU プロファイリングとかができるんですが、今やってみたら「選択した時間に実行されたコードはありませんでした」と言われて全くデータが取れません。

Read the rest of this entry

Rocket Lake, Coffee Lake, Haswell, Sandy Bridge で速度比較をしました。

Read the rest of this entry