マルチスレッドでのメモリ速度

マルチスレッドでアクセスするとメモリ帯域はどのくらい伸びるのか、あるいは伸びないのか、実験。

特に5960Xだとどうなるか…。

マルチスレッドでのメモリ速度の測定は、RMMTでもできるのだけど、8C/16TのCore i7 5960Xで実行すると、物理8コアを使ってくれず、4コア/8スレッドで測定してしまう。

そこで、ちゃんと8コア分測定できるようなコードを書いて、結果をcsvで出力させた。あとはExcelでグラフ化。
そのプログラムはこちら

CPUi7 5960Xi7 4770Ki7 3770KA10 7850i7 4610Y
コア数4C/8T4C/8T4C/8T2M/4T2C/4T
Core4.4GHz4.4GHz4.4GHz4.4GHz-2.9GHz
UnCore4.0GHz4.0GHz4.4GHz--2.9GHz
RAMDDR4-2666DDR3-2600DDR3-2133DDR3-2496DDR3-1600
ChannelQuadDualDualDualDual
CL15-15-15-36-110-12-12-31-29-11-10-28-211-13-13-31-211-11-11-28-1




まず、Readから。

ram_speed_20141101_read.png

Quad-Channelの圧倒的な帯域が目を引く。

Dual-Channelのものが2スレッドあたりでだいたい飽和してしまうのに対し、Quad-Channelものは6スレッドまで帯域が伸び続ける。特に5スレッドまではかなり良く伸びている。

理論帯域に対する効率
i7 5960X + DDR4-2666, 4ch81.4%
i7 4770K + DDR3-2600, 2ch86.4%
i7 3770K + DDR3-2133, 2ch88.2%
i7 4610Y + DDR3-1600, 2ch73.6%
A10-7850K+ DDR3-2496, 2ch53.1%


Core i7 5960X / 4770K / 3770Kは、理論値に対して8割以上出ている。AMDはなんというか、残念です。



次にWrite。

ram_speed_20141101_write.png

こちらも似たような感じ。
ただ、Readと異なり、Dual-Channelのものは2スレッドで完全に飽和してしまう。



というわけで、5960XのQuad-Channelだと並列化すればメモリアクセス速度も順調に伸びてくることがわかった。4770Kのように並列化したけどメモリアクセスのせいで速くならない、みたいなことはなさそうだ。


スポンサーサイト



コメントの投稿

非公開コメント

プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先: rigaya34589@live.jp
github twitter

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutl 出力プラグイン
x264guiEx 3.xx
- x264を使用したH264出力
- x264guiExの導入紹介動画>
- x264guiExの導入
- x264guiExのエラーと対処方法>
- x264.exeはこちら>

x265guiEx
- x265を使用したH.265/HEVC出力
- x265guiExの導入>
- x265.exeはこちら>

QSVEnc + QSVEncC
- QuickSyncVideoによるHWエンコード
- QSVEnc 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC
- NVIDIAのNVEncによるHWエンコード
- NVEnc 導入/使用方法>
- NVEncCオプション一覧>

VCEEnc + VCEEncC
- AMDのVCE/VCNによるHWエンコード
- VCEEnc 導入/使用方法>
- VCEEncCオプション一覧>

svtAV1guiEx
- SVT-AV1によるAV1出力
- svtAV1guiExの導入>
- SVT-AV1単体はこちら>

VVenCguiEx
- VVenCによるVVC出力
- VVenCguiExの導入>

ffmpegOut
- ffmpegを使用した出力
- ffmpegOutの導入>


○Aviutl フィルタプラグイン
自動フィールドシフト (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: aji様

clfilters 
- OpenCLベースの複数のGPUフィルタ集
- 対応フィルタの一覧等はこちら

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX512対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: まじぽか太郎様

PMD_MT
- SSE2~AVX512による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
Amatsukaze改造版
- AmatsukazeのAV1対応版

rkmppenc
- Rockchip系SoCのhwエンコーダ

x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定
- これまでの測定結果はこちら

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)
SVT-AV1 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR