或るプログラマの一生

1月

19

Windows 上での Visual C++ と GCC/Clang の相互運用（その７）

梅澤威志技術ネタ Add you comment

その６の続き

今までずっと x86 を試していましたが、 x64 ではどうでしょうか。

Read the rest of this entry

1月

15

[UtVideo] バージョン 17.3.0

梅澤威志 Ut Video Codec Suite 39 comments

機能追加

ULY2, ULH2, ULY0, ULH0: YV16 での入出力に対応した。

性能向上

ULY4, ULH4, ULY2, ULH2, ULY0, ULH0: ネイティブな planar フォーマットでの入出力を高速化した。

Read the rest of this entry

1月

12

Visual C++ は x64 をターゲットにする場合 MMX の intrinsic をサポートしない

梅澤威志技術ネタ Add you comment

何をいまさら、と思われるでしょうが、記事タイトルの通りです。

最近 Ut Video Codec Suite の脱アセンブラのために intrinsic への書き換えを進めているのですが、既存の MMX 命令を使ったルーチンを intrinsic に書き換えようとしたらこの問題にぶつかりました。GCC はサポートするようです。

x86 をターゲットにする場合でも、本質的に同じ命令列になるような SSE2 向けのコードと MMX 向けのコードとで最適化の頑張り具合が違う（MMX 向けだと中途半端）という現象が発生しており、その意味でも MMX は推奨されないように見えます。

Ut Video Codec Suite は元々 SSE2 をサポートする CPU 向けであるのに MMX 命令なルーチンがあるのは、書いた当時 (Conroe) は実測したら SSE2 命令で書くより速かったからです。しかし、いろいろ試行錯誤した結果、少なくとも Sandy Bridge だと legacy SSE ではほとんど変わらず、VEX prefixed SSE では有意に速くなるという結果が得られたので、 MMX にはこだわらなくても良さそうです。 Nehalem でどうなるかは気になるところですが。

1月

03

Lossless Video Codec Benchmark 2016

梅澤威志 Ut Video Codec Suite, 技術ネタ Add you comment

(This article is English translation of Japanese version. My personal impression is omitted.)

I have benchmarked three latest codecs and one classic codec.

Read the rest of this entry

日	月	火	水	木	金	土
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

プログラミングからチラシの裏まで

Windows 上での Visual C++ と GCC/Clang の相互運用（その７）

[UtVideo] バージョン 17.3.0

Visual C++ は x64 をターゲットにする場合 MMX の intrinsic をサポートしない

Lossless Video Codec Benchmark 2016

カレンダー

アーカイブ

カテゴリー

他のサイトのマイページ