バグ修正
  • UMRG, UMRA: SSE4.1 が使えて AVX2 が使えない環境において、幅が 64 で割って 32 余る数の場合のフレーム内圧縮のエンコード結果が誤っていた。

Read the rest of this entry

性能向上
  • UMxx: ネイティブな packed フォーマットでのフレーム内圧縮の入出力を高速化した。

Read the rest of this entry

機能追加
  • プロセス名に基づいて、あるいは完全に特定のコーデックインターフェースを無効化する機能を追加した。

Read the rest of this entry

前の記事であるUTF-8のコードポイントはどうやってもっと高速に数えるかで AVX2 での高速化をやりましたが、今ではさらにベクタの長い AVX-512 というものがあるので、これでもやってみようかと思います。なお、想定するプロセッサは Skylake-X です。

Read the rest of this entry

Qiita に UTF-8のコードポイントはどうやって高速に数えるかという記事がありました。コードを眺めながらもっと速くなるんじゃないのと思ったので、やってみようと思います。

Read the rest of this entry

Windows 上での Visual C++ と GCC/Clang の相互運用という記事を書いてましたが、さっき調べたらオリジナルの LLVM (Clang/C2 ではない)を Visual Studio のプラットフォームツールセットとして使うことができて MSVC とちゃんと互換性があるということを知りました。

Read the rest of this entry

blog を見ている人には基本的に関係のない話ですが、自鯖(この blog が動いているサーバ)の OS (distro) を CentOS 6 から Ubuntu 18.04 LTS に変更しました。

Read the rest of this entry

最近(?)の x86 系パフォーマンスデスクトップ向け製品(Intel ならメモリがトリプル/デュアルチャネルの Core i7 のあたり)のマイクロアーキテクチャ (MA) ごとのキャッシュの構成の一覧。

Read the rest of this entry

性能向上
  • ULxx: ネイティブな packed フォーマットでの入出力を高速化した。
その他
  • ULxx: 「インターレース映像としてエンコード」を非推奨機能とした。
  • QuickTime コンポーネントの事実上の廃止にともない、readme から情報を削除した。

Read the rest of this entry

前の記事で ULxx の median decode が遅くなると書きました。実際どうなってるのかという話です。

Read the rest of this entry