- 性能向上
-
- all: AVX512-VBMI2 が使える環境での、内部 YUV444/YUV422 のバリアントの RGB24/32 での入出力を高速化した。
Read the rest of this entry
手元の 20.04 に GCC (g++) をインストールしようとしたら、見慣れないエラーが出てきました。
Read the rest of this entry
ちょちょいと高速化しました。
Read the rest of this entry
以前、AVX2 による並列ハフマンデコードを試したことがあって、その時には利点が無いという結論になっていました。
Read the rest of this entry
- 性能向上
-
- UMxx: AVX512-VBMI2 が使える環境でのエンコードを高速化した。
- UMxx: フレーム間圧縮のデコードを高速化した。
- all: AVX512-VBMI2 が使える環境での RGB32/RGBA/YUY2/UYVY へのデコードを高速化した。
Read the rest of this entry
ベンチマークプログラムを書き直したのでちゃんと測ってみました(10日ぐらい前の話ですが)。計測対象は前記事と同じく Rocket Lake です。
Read the rest of this entry
雑にちょっとだけ測っただけなんですが、(Rocket Lake において) AVX-512 のマスクレジスタを使った時のレイテンシの増加は1で固定「ではない」ということが分かりました。
Read the rest of this entry
- 性能向上
-
- UMxx: AVX512-VBMI2 が使える環境での入出力を高速化した。
- その他
-
Read the rest of this entry
Visual Studio 2019 にはパフォーマンスプロファイラーが付いていて、 CPU プロファイリングとかができるんですが、今やってみたら「選択した時間に実行されたコードはありませんでした」と言われて全くデータが取れません。
Read the rest of this entry
Rocket Lake, Coffee Lake, Haswell, Sandy Bridge で速度比較をしました。
Read the rest of this entry