7980XEのキャッシュ/メモリ帯域

7980XEはキャッシュとメモリ速度の測定。

7980XEはAVX512対応に伴い、ついにL1キャッシュについてはRead 128byte/cycle, Write 64byte/cycleとなった。またL2もかなり強化され、高速かつ大容量に。

そのかわりL3が…。

環境



比較する環境はこちら。以前やった3.6GHz固定のものと同じです。

CPUi9 7980xei7 5960xR7 1700
コア数18C/36T8C/16T8C/16T
Max Coreクロック3.63.63.6
Max Uncore/Meshクロック3.03.6-
メモリ速度DDR4-2666, 4chDDR4-2666, 4chDDR4-2666, 2ch
メモリ容量16GB32GB8GB
マザーAsrock X299 OC FormulaAsrock Fatalty X99 Gaming i7Asrock AB350 Pro4
OSWin10 Pro x64Win10 Pro x64Win10 Pro x64


測定につかったのはこちら。AVX-512対応済み。



まず、シングルスレッドから。
L1 = 32KBまで
L2 = 1024KBまで
L3 = 26368KBまで

片対数グラフ。


下のほうがわかりにくいので両対数版も。


AVX-512対応に合わせ、L1/L2キャッシュの領域で非常に高速になっている。

ただ、L3キャッシュは29GB/sというまさかの遅さで、5960Xや1700よりだいぶ遅いという事態に。メッシュを3.0GHzまで引っ張ってこれだから、デフォルトだといったいどれだけ遅いのだろうか。

リングからメッシュにしたことで速くなったみたいな話があったが、レイテンシはともかく帯域の面ではかなり遅くなってしまっていることがわかる。



次にマルチスレッド。
L1 = 576KBまで
L2 = 18432KBまで
L3 = 43776KBまで

片対数グラフ。


下のほうがわかりにくいので両対数版も。


18コアもあるためにL1キャッシュの速度の総和がすさまじいことになり、7.7TB/sにもなっている。L2も3TB/s弱と恐ろしい速度。ところがL3が弱いのはマルチスレッドでも明白で、300GB/sちょいと、8コアの5960XのL3と同じぐらい。



今度はスレッド数を変えた時のメモリアクセス速度(読み込み)。



7980XEは1スレッドの速度はあまり振るわないもののかなり優秀で、同じDDR4-2666, 4chの5960Xと比べても、特に並列数を増やした時の帯域が増していて、最大で75GB/s前後出ている。



Skylake-Xでは、いろいろなベンチマークでよいスコアが出ているが、今回はかってみてわかったように、L1/L2の強化、実行メモリ帯域の向上などの効果も大きいのかと思う。

一方L3の帯域は18コアのわりに残念なことに…。(しかもオーバークロック状態なのに…)

まあそれでもいろんなベンチマークで良いスコアが出ているということは、大容量キャッシュによるレイテンシ削減の効果が重要で、帯域自体はこのぐらいでよいということかもしれないし、あるいはL1/L2の性能向上のインパクトが大きくて、L3の問題を覆い隠しているのかもしれない。


スポンサーサイト



コメントの投稿

非公開コメント

プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先: rigaya34589@live.jp
github twitter

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutl 出力プラグイン
x264guiEx 3.xx
- x264を使用したH264出力
- x264guiExの導入紹介動画>
- x264guiExの導入
- x264guiExのエラーと対処方法>
- x264.exeはこちら>

x265guiEx
- x265を使用したH.265/HEVC出力
- x265guiExの導入>
- x265.exeはこちら>

QSVEnc + QSVEncC
- QuickSyncVideoによるHWエンコード
- QSVEnc 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC
- NVIDIAのNVEncによるHWエンコード
- NVEnc 導入/使用方法>
- NVEncCオプション一覧>

VCEEnc + VCEEncC
- AMDのVCE/VCNによるHWエンコード
- VCEEnc 導入/使用方法>
- VCEEncCオプション一覧>

svtAV1guiEx
- SVT-AV1によるAV1出力
- svtAV1guiExの導入>
- SVT-AV1単体はこちら>

VVenCguiEx
- VVenCによるVVC出力
- VVenCguiExの導入>

ffmpegOut
- ffmpegを使用した出力
- ffmpegOutの導入>


○Aviutl フィルタプラグイン
自動フィールドシフト (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: aji様

clfilters 
- OpenCLベースの複数のGPUフィルタ集
- 対応フィルタの一覧等はこちら

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX512対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: まじぽか太郎様

PMD_MT
- SSE2~AVX512による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
Amatsukaze改造版
- AmatsukazeのAV1対応版

rkmppenc
- Rockchip系SoCのhwエンコーダ

x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定
- これまでの測定結果はこちら

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)
SVT-AV1 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR