Rocketlakeのアイドル電力を下げると…?

Power Limitありだと、わずかに性能が上がることもあるっぽい?


Rocketlake(i7 11700K)では妙にアイドル時の電力が高い、というのは以前書いた通り。

消費電力を測る機材はないので、実際のところはよくわからんが、HWiNFO読みだと、Package Powerが15Wを切らない、という問題があった。(以下出てくる電力値はすべてHWiNFO読み)

i7_11700K_HWINFO_20210404_unlimited_x265_slower.png

そこでまず、メモリコントローラの速度をGear1→Gear2に変更し、VCCSAをAuto(1.05V)から0.9Vに下げた。

効果は絶大で、System Agentの電力が8W→3W以下まで下がった。

i7_11700K_HWINFO_20210411_gear2_idle_power_aspm_off.png

それでも"Rest-Of-Chip"が下がらないなあ、と思ってBIOSの細かい設定を眺めていると、"Platform Power Management"という設定の中にASPM(Active State Power Management)の設定があり、これはBIOSのデフォルトのままにしていたのだが、これがすべてDisabledになっていた。これを有効にすると、"Rest-Of-Chip"も下がって以下の通り。

i7_11700K_HWINFO_20210411_gear2_idle_power.png

CPU Package Powerがアイドル時もともと15Wぐらいあったのを5Wまで抑え込めた。



ただ、メモリコントローラをGear2にしたことによって性能は下がるはずで、それがどのくらいなのかな、というのが気になるところ。

なので、まずはいつものメモリアクセス速度を測定するプログラムでこのあたりを測定した。



まずはマルチスレッド使用時のメモリ帯域から。ここではGear1とGear2の差は見えてこない。

11700K_ram_speed_20210411_bandwidth_mt.png



次にシングルスレッド使用時のメモリ帯域。データサイズの大きいところがメモリアクセスだけど、このあたりでGear2は遅くなっているのがわかる。

11700K_ram_speed_20210411_bandwidth_st.png



スレッド数を変えた時のメモリ帯域。Gear1とGear2の差は、シングルスレッド時のが大きく、スレッド数を増やしていくとあまり変わらなくなるようだ。

11700K_ram_speed_20210411_bandwidth_thread.png



キャッシュラインに対してランダムになるべく4Kページをまたがないようにアクセスしたときのレイテンシ。

データサイズの大きいところがメモリアクセスだけど、Gear2はわずかにそのあたりのレイテンシが増加している。

11700K_ram_speed_20210411_latency_cacheline_random.png



完全にランダムにアクセスしたときのレイテンシ。やはりGear2はわずかにデータサイズの大きいメモリアクセスとなるところのレイテンシ増加が見られる。

11700K_ram_speed_20210411_latency_full_random.png



というわけで、Gear2にすると(当然だが)メモリアクセスがある程度遅くなるが、その差は決して大きいものではない、ということがわかった。

じゃあ、実際これが実アプリの動作にどのくらい効くの? ということで、この状態で再度ベンチマークをやってみよう。

今回は、Power Limitに関しては以前計測したPL1=125W, PL2=251Wの設定のまま。

CPUi7 11700K 0x34
PL1:125 / PL2:251
Gear1
PL1:125 / PL2: 251
Gear2 + ASPM ON
コア数8C/16T
L2 Cache4MB
L3 Cache16MB
AVX512Offset=0
Core
Voltage
Auto
PPT/PL1125W
PL2251W (56sec)
IccMaxAuto
ASPMDisabled (Default)Enabled
Uncore4100MHz
メモリDDR4-3600
2ch
メモリ容量16GB
タイミング18-22-22-45-2
メモリ FCLKGear1Gear2
VCCSAAuto (1.05V)0.90V
マザーGigabyte
Z590I AORUS ULTRA (F5a)
冷却Thermaltake
Water 3.0 Riing Edition 280
電源Seasonic
SS-620GB
ケースPhanteks
Evolv Shift X


使用ソフト
Cinebench R15, R20, R23
7zip 19.00
Aviutl 1.00 / x264guiEx 2.65 / x265guiEx 3.101 / svtav1guiEx 0.04
x264 rev3027 x64
x265 3.4+28 x64



Cinebench R15



これはマルチスレッドのほうで少しスコアが下がってしまった。(ぶれの範囲内かもしれないが)

11700K_benchmark_20210411_cinebench_r15.png



Cinebench R20



こちらはほぼ変わらない結果に。

11700K_benchmark_20210411_cinebench_r20.png



Cinebench R23



こちらもほぼ変わらない結果に。

11700K_benchmark_20210411_cinebench_r23.png



7zip benchmark



ほんのごくわずかだが、Gear2にしたことでスコアが落ちている気がする。

11700K_benchmark_20210411_7zip.png



x264 1080p エンコード



Aviutlでmpeg2 1080p 5203frame(sample_movie_1080p.mpg)をlwinput.auiで読み込み、x264guiExで出力。
オプション: --preset

これはCPU使用率の高くなってくるfastより重いプリセットでは、Gear2+ASPM ONのほうが、わずかに速度が上がっている。

11700K_benchmark_20210411_x264.png



x265 1080p エンコード



Aviutlでmpeg2 1080p 5203frame(sample_movie_1080p.mpg)をlwinput.auiで読み込み、x265guiExで出力。
オプション: --crf 21 --output-depth 8/10 --preset --asm avx512

これもx264同様に、Gear2+ASPM ONのほうが、わずかに速度が上がっている。

11700K_benchmark_20210411_x265_8bit.png



10bitも8bitと同様。ほんのわずかだけど、Gear2+ASPM ONのほうが速度が上がっている気がする。

11700K_benchmark_20210411_x265_10bit.png



ということで、ここまでの結果では、Gear2+ASPM ONにすると遅くなるものもある一方で、速くなるものもあるということになった。

Gear2にしてメモリアクセスは遅くなっているのになんで速くなるのか、というと、

・今回Gear2にしてVCCSAを下げ、ASPMを有効にしたことによって、System AgentとRest-Of-Chipの消費電力が10W下がった
 ↓
・PL1=125Wの枠内で動作するとき、CPUコアが使える電力枠がその分10W増えた
 ↓
・その分CPUのクロックが少し上がりやすくなった
 ↓
・CPUクロック上昇効果が、Gear2にしたことによるメモリアクセス性能低下の影響を上回った

という感じだと思う。



もちろん、あまり気にする必要もないぐらいわずかの差だとは思う。

さらに、Power Limitをかけていない、あるいはその制限の影響を受けないぐらい時間が短い、あるいはCPU使用率が低い場合には、Gear1のほうがもちろん速いと思う。ゲームとかはこうした部類に入ってくるのかもしれない。

ただ、K付きでないCPUなどで、Power Limitを外せない場合などでは、なるべくアイドル電力を下げるというのも有効なのかな、と思った。



BIOSの設定をちゃんとよく見ろ、と言われればまあそれまでだけど、Package Power ManagementはBIOSのデフォルトでオフになっていたわけで、これはデフォルトでオンにしておいてほしいなあ、と思ったり。

なにはともあれ、若干気になっていたので、RocketlakeでもBIOS設定をいじればアイドル電力を従来と同程度まで下げられることがわかってよかった。
スポンサーサイト



コメントの投稿

非公開コメント

プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先(@を半角にしてください!)
rigaya34589@live.jp
github

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutlプラグイン
x264guiEx 2.xx (ミラー)
- x264を使用したH264出力
- x264guiExの導入>
- x264.exeはこちら>

x265guiEx (ミラー)
- x265を使用したH.265/HEVC出力
- x265.exeはこちら>

QSVEnc + QSVEncC (ミラー)
- QuickSyncVideoによるH264出力
- QSVEncCはコマンドライン版
- QSVEncC 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC (ミラー)
- NVIDIAのNVEncによるH264出力
- NVEncCオプション一覧>

VCEEnc + VCEEncC (ミラー)
- AMDのVCEによるH.264出力
- VCEEncCオプション一覧>

svtAV1guiEx (ミラー)
- SVT-AV1によるAV1出力

ffmpegOut (ミラー)
- ffmpeg/avconvを使用した出力

自動フィールドシフト (ミラー)
- SSE2~AVX2による高速化版
- オリジナル: aji様

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX2による高速化版
- オリジナル: まじぽか太郎様

PMD_MT (ミラー)
- SSE2~FMA3による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (ミラー使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR