Vegas Movie Studio HD Platinum 10.0 (以下 Vegas)で Ut Video Codec Suite でエンコードされた映像を素材として使っているとかなり落ちやすい、という報告を受けました。

体験版で試したところ確かに落ちるんですが、デバッガで一般保護例外を捕まえられません。Vegas はマネージドコードで動いているようなのですが、最初はマネージドコードとしてアタッチしてしまって utvideo.dll すら見えないという状態でした。これはネイティブコードとしてデバッグするように明示したらとりあえず utvideo.dll が見えるようになったのでこれに関してはOK。しかし落ちてもデバッガで例外を捕まえることができず、Vegas が内蔵しているエラーリポート機能が起動してしまいます。ブレークポイントを設定すると止めることはできますが、秘孔を突いて1発で落ちるような問題ではないので、これでは意味がありません。

これではデバッグができない…

ここしばらくは Range Coder と格闘していましたが、結果として Lagarith より圧縮率がちょっと(2%ぐらい)良くて、エンコード速度がちょっと速い(シングルスレッドの場合)ものが作れそうだ、という技術的検証まではできました(デコード処理は書いてないので不明)。まあ、Lagarith のアルゴリズムをほんのちょっとだけ改良しただけなのでこんなもんでしょう。アルゴリズムに新規性が無いのは昔からなのでその点は気にしないことにします。

Read the rest of this entry

Ut Video Codec Suite は、開発初期の目標はともかくとして、「そこそこの圧縮率でかなりの速度の編集用コーデック」という方向にバージョンアップを重ねています。「かなりの速度」という点に関しては、アルゴリズムレベルや実装(アセンブラ)レベルでの継続的な改良により、満足できるレベルを達成できていると思っています。

Read the rest of this entry

性能向上
  • 共通: x86 でのデコードを 10% ほど高速化した。
  • 共通: x64 版をアセンブラ化し、おおむね x86 版と同程度の速度にした。

Read the rest of this entry

x86版でアセンブラ化されているところは全てx64版でもアセンブラ化したので、ここいらでまたベンチマーク結果を載せておきます。基本的にはベタ移植なので速度はほとんど同じはずですが、ハフマンデコードに関してはメモリアクセス回数削減の効果が期待されるところです。なお、x64版のアセンブラ化の過程で、どちらに対しても適用できるデコードの高速化を行ったため、x86とx64の両方を再計測しています。

Read the rest of this entry

そろそろ x64 版のアセンブラ化に着手しようと考えていますが、着手する前に、処理負荷の傾向がどうなっているかを比較しておこうと思います。

Read the rest of this entry

性能向上
  • ULRG: デコード速度優先でエンコードされたものの RGB24 や RGB32 へのデコードを高速化した。Core 2 で x86 の場合 14% ほど、x64 の場合 6% ほど。
  • ULRA: デコード速度優先でエンコードされたものの RGBA へのデコードを高速化した。Core 2 で x86 の場合 17% ほど、x64 の場合 6% ほど。

Read the rest of this entry

性能向上
  • ULY2: デコード速度優先でエンコードされたものの YUY2 や UYVY へのデコードを高速化した。Core 2 で 12% ほど。
  • ULY0: デコード速度優先でエンコードされたものの YV12 へのデコードを高速化した。Core 2 で 5% ほど。
その他
  • ULY2: YVYU と VYUY での入出力のサポートを廃止した。
  • ULY0: YVYU と VYUY での入出力のサポートを廃止した。

Read the rest of this entry

次のバージョンで YVYU と VYUY での入出力を廃止しようとしています。これが廃止されて困る人はまずいないと思うのですが、万が一困るという珍しい人は理由を添えて異議を申し立ててください。

廃止する理由ですが、きっちり検証できないものが実装されたままになっているのはまずいだろうという判断です。じゃあなんで実装したのよと聞かれると困るのですが。

その他
  • ULY2: デコード時に RGB32 で出力する場合、安全のためアルファチャンネルと解釈されうるフィールドは 255 で埋めるようにした。
  • ULY0: デコード時に RGB32 で出力する場合、安全のためアルファチャンネルと解釈されうるフィールドは 255 で埋めるようにした。

Read the rest of this entry