Rocket Lake, Coffee Lake, Haswell, Sandy Bridge で速度比較をしました。

ソフトウェア
  • Ut Video Codec Suite 22.2.0
  • vctest 2.4.0
Rocket Lake
  • CPU: i5-11400 / Base 2.6GHz, TB Max 4.4GHz / 6C12T
  • Mem: DDR4-3200 22-22-22-52 / 64GB / Gear1
  • XTU: PL1=154W
Coffee Lake
  • CPU: i7-8700 / Base 3.2GHz, TB Max 4.6GHz / 6C12T
  • Mem: DDR4-2666 16-18-18-35 / 64GB
Haswell
  • CPU: i7-4770 / Base 3.4GHz, TB Max 3.9GHz / 4C8T
  • Mem: DDR3-1600 11-11-11-28 / 32GB
Sandy Bridge
  • CPU: i7-2600K / Base 3.4GHz, TB Max 3.8GHz / 4C8T
  • Mem: DDR3-1600 9-9-9-28 / 32GB

Rocket Lake だけちょっと設定が特殊で、クロックを安定させる(PL2が適用されている期間とPL1が適用されている期間とでクロックが異なるのを防ぐ)ことを目的として Intel XTU で PL1 の設定を上げています。ただし、ベンチマーク期間中の消費電力の実測値は、本来の PL1 の値である 65W を超えることはありませんでした。

Rocket Lake での性能の Coffee Lake との比較として、以下の予想をしていました。

  • ULxx (st) のエンコードは、Cove MA でストアが1クロックに2回できるようになったことによりシンボルのカウント処理が高速化され、33% の高速化となる。
  • UMxx (mt) のエンコード及びデコードはメモリ帯域で律速しているので、20% の高速化となる。 (3200/2666 = 1.2)

で、結果。あまりテストケースを多くしてもしょうがないので削っているのと、 ULxx (mt) は見るべき点が無かったので省略してます。

Rocket Lake の結果は以下のような感じです。

  • ULxx (st) のエンコードでは、予想していたほどには速くなかった。また、 RGB32->ULRG と YUY2->ULY2 は他と比べて上昇率が低く、アンパック命令が妙に遅いのではないかと推測される。
  • ULxx (st) のデコードでは、ほとんど変わっていないか、むしろ遅くなっているケースもある。クロック比を考えると若干(5%ぐらい)遅くなることは考えられるが、それ以上に遅くなっているケースがある。
  • UMxx (st) のエンコード及びデコードでは、かなり高速化されている。
  • UMxx (mt) のエンコード及びデコードでは、メモリ帯域比より大きな高速化がみられる。大きいところでは +40% とかなっている。メモリコントローラの効率が高くなったのだろうか。

ふーむ。

Trackback

no comment untill now

Add your comment now