7月
10
- 性能向上
-
- ULxx, UQxx: predict gradient および predict left のマルチスレッド時のデコードを高速化した。
- UMxx: マルチスレッド時のデコードを高速化した。
readme 日本語, 英語 / ライセンス (GPLv2) 日本語, 英語
バイナリ Windows exe installer, zip package, logger tool / ソース / GitHub
非テンポラルなストアを活用して、映像の幅とバッファのアドレスが十分にキリのいい場合にデコードを高速化しました。
どれくらいならキリがいいのかは、使われるベクトルレジスタの長さに依存します。ざっくり言えば新しいプロセッサほど条件が厳しくなるのですが、よく使われる解像度なら最新のプロセッサでも問題ありません。条件に合わない場合でも以前と同じ速度で動くので安心です。
なお、「マルチスレッドの時」と書いていますが、これは実際には「メモリ帯域をたくさん使うぐらいの性能が出ている場合」という意味です。 UMxx だとシングルスレッドでもメモリ帯域をかなり使うので高速化の効果があります。
お借りいたします。
お借り致します。ありがとうございます。
お借りします!
お借りします
お借りします!
お借りします。ありがとうございます。
お借りいたします。ありがとうございます。
お借りします。ありがとうございます。
お借りします!