性能向上
  • ULxx, UQxx: predict gradient および predict left のマルチスレッド時のデコードを高速化した。
  • UMxx: マルチスレッド時のデコードを高速化した。

readme 日本語, 英語 / ライセンス (GPLv2) 日本語, 英語
バイナリ Windows exe installer, zip package, logger tool / ソース / GitHub

非テンポラルなストアを活用して、映像の幅とバッファのアドレスが十分にキリのいい場合にデコードを高速化しました。

どれくらいならキリがいいのかは、使われるベクトルレジスタの長さに依存します。ざっくり言えば新しいプロセッサほど条件が厳しくなるのですが、よく使われる解像度なら最新のプロセッサでも問題ありません。条件に合わない場合でも以前と同じ速度で動くので安心です。

なお、「マルチスレッドの時」と書いていますが、これは実際には「メモリ帯域をたくさん使うぐらいの性能が出ている場合」という意味です。 UMxx だとシングルスレッドでもメモリ帯域をかなり使うので高速化の効果があります。

Trackback

6 comments untill now

  1. お借りいたします。

  2. ヒメクサユリオ @ 2021-08-17 21:03

    お借り致します。ありがとうございます。

  3. しゅがーえっぐ @ 2021-09-02 12:58

    お借りします!

  4. お借りします

  5. りょーや @ 2021-09-05 02:51

    お借りします!

  6. かっち @ 2021-09-14 19:17

    お借りします。ありがとうございます。

Add your comment now