6月に Haswell が出ると予想されています。Haswell には AVX2 が搭載され、256bit レジスタで整数 SIMD 演算ができるようになります。他にも色々と新命令が追加されています。
新命令(具体的には VPGATHERDD)を眺めながら、「これ使ったらハフマンデコードの並列実行ができるんじゃね?」と思って Ut Video Codec Suite のハフマンデコードのアセンブラソースを見ていたのですが、1つ問題点がありました。BSR (Bit Scan Reverse) 命令の SIMD 版が無いのです。
Read the rest of this entry