7980XEのキャッシュ/メモリ帯域 (定格/オーバークロック追加)
7980XEはキャッシュとメモリ速度の測定に、定格のデータとオーバークロックのデータを追加。
まず、シングルスレッドから。
L1 = 32KBまで
L2 = 1024KBまで
L3 = 26368KBまで
片対数グラフ。

下のほうがわかりにくいので拡大版も。

コアのオーバークロックの結果が素直にL1/L2キャッシュの速度に出ている。
一方、L3キャッシュはメッシュのクロックをオーバークロックしているかどうかが見えている。定格から3.0GHzにオーバークロックすることで、帯域が25GB/sから30GB/sまで上昇していることがわかる。定格のメッシュクロックは最大2.4GHzの模様。
次にマルチスレッド。
L1 = 576KBまで
L2 = 18432KBまで
L3 = 43776KBまで
片対数グラフ。

下のほうがわかりにくいので拡大版も。

こちらもコアのオーバークロックの結果が素直にL1/L2キャッシュの速度に出ていて、メッシュのクロックの差がL3キャッシュの速度に出ている。
また、DDR4-2666とDDR4-3200の違いも大きくはないがそれなりにはっきり出ている。
今度はスレッド数を変えた時のメモリアクセス速度(読み込み)。

DDR4-2666からDDR4-3200に上げることで、75GB/sから88GB/sへ増速。しかし、ピークは12スレッド前後のところに来ていて、帯域を使い切るのはなかなか難しい印象。
シングルスレッドではまるでメモリ帯域を使えておらず、メモリコピー、あるいはそれに近い色空間変換などのような処理でも並列化しないと速度が出ないということで、プログラムを作る場合にはやや面倒だったりする。
まず、シングルスレッドから。
L1 = 32KBまで
L2 = 1024KBまで
L3 = 26368KBまで
片対数グラフ。

下のほうがわかりにくいので拡大版も。

コアのオーバークロックの結果が素直にL1/L2キャッシュの速度に出ている。
一方、L3キャッシュはメッシュのクロックをオーバークロックしているかどうかが見えている。定格から3.0GHzにオーバークロックすることで、帯域が25GB/sから30GB/sまで上昇していることがわかる。定格のメッシュクロックは最大2.4GHzの模様。
次にマルチスレッド。
L1 = 576KBまで
L2 = 18432KBまで
L3 = 43776KBまで
片対数グラフ。

下のほうがわかりにくいので拡大版も。

こちらもコアのオーバークロックの結果が素直にL1/L2キャッシュの速度に出ていて、メッシュのクロックの差がL3キャッシュの速度に出ている。
また、DDR4-2666とDDR4-3200の違いも大きくはないがそれなりにはっきり出ている。
今度はスレッド数を変えた時のメモリアクセス速度(読み込み)。

DDR4-2666からDDR4-3200に上げることで、75GB/sから88GB/sへ増速。しかし、ピークは12スレッド前後のところに来ていて、帯域を使い切るのはなかなか難しい印象。
シングルスレッドではまるでメモリ帯域を使えておらず、メモリコピー、あるいはそれに近い色空間変換などのような処理でも並列化しないと速度が出ないということで、プログラムを作る場合にはやや面倒だったりする。
スポンサーサイト