Ryzen 9 7950XでのPPT調整

Ryzen 9 7950Xでは、大幅に動作クロックを向上させ、PPTを定格で230Wに設定されていて、「95℃まで全力でぶん回す」仕様のCPUとなっている。

実際、自分の環境では冷却性能の限界で200W程度までしかPPT枠を使えていなくて、PPTよりも温度制限95℃が事実上のリミッターになっている。

では、PPTを下げていった場合に、どのように性能が変化するのかチェックした。

また、一部のテストを細かく見ていき、実際のCPUコア部分の消費電力や、そのときの効率もチェックしてみた。




まず、比較する環境だが、7950XではPBO2のCurve Optimizer、12900KではAdaptive OffsetのV-F Curve指定で可能な限り電圧下げをした状態で比較する。

Ryzen9 7950X PBOCOi9 12900K VF
コア数16C/32T8P+8E/24T
L216MB14MB
L364MB30MB
OCPBO2+CO -5 ~ -18VF Offset~ -0.13V
PPT/PL指定値
TDC/EDC160A/225AUnlimited
メモリDDR5-6000DDR4-3600 2ch
メモリ容量32GBx28GBx4
タイミング32-38-38-96-116-19-19-39-1
メモリ FCLK1:1Gear1
マザーMSI Pro X670-P WIFIMSI MAG Z690
TOMAHAWK WIFI DDR4
冷却Fractal Design
Celsius+ S28 Prisma
Corsair iCUE H150i RGB PRO XT
電源Seasonic FOCUS PX-750Seasonic FOCUS PX-750
ケースDefine 7 Compact LightTGThermaltake Core V71
OSWindows 11Windows 11


7950XのCurve Optimizerの設定はこんな感じ。

CCD0CCD1
Core 1-10Core 9-18
Core 2-10Core 10-18
Core 3-10Core 11-18
Core 4-5Core 12-18
Core 5-10Core 13-15
Core 6-15Core 14-15
Core 7-12Core 15-8
Core 8-5Core 16-8


また、12900KのVF Curveの設定はこんな感じ。

800MHz0
1800MHz-0.01V
3600MHz-0.02V
4000MHz-0.06V
4200MHz-0.10V
4800MHz-0.13V
5300MHz-0.13V


使用ソフト
Cinebench R23
7zip 22.01
Aviutl 1.00 / x264guiEx 3.15 / x265guiEx 4.06 / svtav1guiEx 1.09
x264 rev3095 x64
x265 3.5+36 x64
y-cruncher 0.7.10



比較方法



BIOSでPPTを指定値に設定し、一連のベンチマークを実行。12900Kの場合はPL1=PL2となるよう同じ値に設定した。

また、あとで細かく分析するため、HWiNFO64でログを取得しながらベンチマークを実行している。そのため、わずかにベンチマークのスコアが下がっている。



Cinebench R23



横軸にPPT/PLを、縦軸にCinebenchのスコアをとった。


グラフが表示されない場合はこちら

PPTを下げていくとスコアは当然下がっていくが、途中まではスコアの変化は緩やか。

例えば7950XでPPT=200Wのスコアは38198だが、160Wは36924、100Wでも31980ある。

ただ、このあたりからさらに下げるとさすがにスコアは急落していき、50Wで約半分の19348になっている。(逆に1/4の電力で1/2のスコアが出せるともいうかも)

7950Xでは、30Wあたりでスコアが0になりそう。これはIODダイやCCDダイのアイドル電力が高く、常時CPU Package Powerが18~26W前後あるためで、実際負荷をかけた状態では最低動作周波数でも32Wを割るのが難しい。

12900Kもスコアの絶対値の違いはあるけどだいたい同じ傾向になっている。

ただ、12900Kは低電力領域では7950Xを上回っていて、10Wでも余裕で動かすことができる。これは、12900Kのアイドル電力がかなり小さいため。

このあたりは、サーバー(EPYC)とダイを共有する7950Xと、モバイル向けと大きくは変わらない12900Kの違いがはっきり出ているように思う。



7zip



同じように7zip。


グラフが表示されない場合はこちら

7zipベンチマークは、Cinebenchほどベンチマーク中の消費電力が高くないため、特に12900Kでは100W以上にしていっても明らかな差は見えない。

7950Xでは、100Wを超えてもdecompressのほうは少しずつスコアが伸びているが、compressのほうはほとんど変化しない。



y-cruncher



横軸にPPT/PLを、縦軸に計算時間をとった。


グラフが表示されない場合はこちら

7950Xでは120W以上、12900Kでも140W以上では変化がない。



x264



横軸にPPT/PLを、縦軸にエンコード速度(fps)をとった。


グラフが表示されない場合はこちら

ざっくり120Wぐらいまで下げていってもあまり大きな変化はないが、それ以下にするとかなり速度低下がみられるという感じになっている。

140W以上に引っ張ったときの速度向上は12900Kより7950Xのほうがわずかに多いだろうか。

45W以下の低電力領域で12900Kが逆転するのもCinebenchと変わらない。



x265 10bit



同じくx265。


グラフが表示されない場合はこちら

これも傾向はx264と同じ。



svt-av1 10bit



svt-av1でも試してみたが、グラフが安定しない。


グラフが表示されない場合はこちら

CPU使用率がx264/x265よりも低く、ちょっと変わった様子になっているし、速度が安定していない。

7950Xと12900Kの差がx264/x265と比べて小さいのも、CPU使用率が低く、Big 16コアの利点を生かせないためだと思う。



より詳細な分析



ここまでで、PPT/PLを下げていっても、ある程度までは性能にそんなに影響しないことがわかった。

ただ、実際にはPPT/PLは電力の上限値であって、実際の消費電力ではないので、

・消費電力を下げてもスコアに影響しづらい領域がある
・実はそこまで電力を消費していなったのか

のどちらかは、実ははっきりしない。(実際にはベンチマークによって両方の要素がある)

また、7950Xの場合には高いアイドル電力の影響があって、実際のCPUコアで演算に使用している電力を見ているわけではない。

そこで、Cinebenchとx264についてより細かく見ていってみる。



Cinebench 詳細



まず、IODやUncore等を除いたコアのみの実消費電力とスコアの関係を見ていく。

ここでコアのみの実消費電力はHWiNFO64の
・7950Xでは CPU Core Power [W]
・12900Kでは IA Cores Power [W]
の値を信じることにしよう。

さらに、集計作業を簡単にするため、HWiNFO64のログのサンプル間隔はほぼ均等であると仮定して、各項目の時間での単純平均をとって、Cinebench中の平均の実消費電力とした。

Cinebenchのグラフで、横軸をコアのみの実消費電力に取り直すとこんな感じ。


グラフが表示されない場合はこちら

IODダイやCCDダイのアイドル電力の下駄がなくなり、7950Xのグラフが全体的に左に動いた。その結果、コア単体だけでみれば、低電力領域でも12900Kと同等か、それ以上とわかる。

12900Kについては、CPU Packageのアイドル電力がかなり小さく、グラフに大きな変化はないが、右側2点が非常に近接している。これは、PL1=PL2=200Wを与えられても、実際にはそこまで電力を消費しないためで、むしろクロック上限(All Core Turbo 4.9GHz)に引っかかっている。



次にクロックがどう変化したか確認。

各時間ごとに全コアのクロックの最大値を取り、そのうえで時間平均をとり、平均のコアクロックを取得した。

グラフが表示されない場合はこちら

グラフの形としては、スコアと同じだが、実際にクロックがどのくらいまで上がっているか確認できる。

7950Xは、最大で5.1~5.2GHzまで上がっている。Cinebenchは全コアに負荷がかかるベンチマークのため、その状態でも16コアが5GHzを超えているということになる。

最近クロックのインフレが進みすぎてもはや驚かなくなってしまったが、よく考えるとなかなかすさまじい。



それにしても100Wオーバーでは電力をどんどん増やしていっても、あまりクロックやスコアが伸びていないわけで、いったい電力効率はどうなっている気になってくる。

そこで、横軸に先ほどの動作周波数を、縦軸にCinebenchのスコア当たりの電力を取ってみる。

ただ、集計の方法がある程度雑なのを割り引いてみる必要がある(このグラフを正確にやるならクロックを固定したほうがよさそう)。

グラフが表示されない場合はこちら

クロックを上げていくと高速になる一方で、スコアあたりの電力が増大してしまうが、これはまあ、クロックを上げるには昇圧が必要である限り、ある程度は仕方ないことだと思う。

問題は、12900Kであれば4.9GHz前後、7950Xでは5.1GHzを過ぎたあたりから傾きが大きくなっていて、効率がかなり悪くなっていること。まあもちろん個体差もあるだろうが、性能を少しでも引き出すため、ぎりぎりまでクロックを引っ張った仕様になっているようだ。



x265 10bit 詳細



同じようにx265 10bitも見てみる。

グラフが表示されない場合はこちら

x265エンコードでは、Cinebenchのようにすべてのコアをフル稼働できるわけではない。そのため、PPT/PL枠を上げていっても最後のほうは消費電力が増えにくくなっている。



次にクロックがどう変化したか確認。

各時間ごとに全コアのクロックの最大値を取り、そのうえで時間平均をとり、平均のコアクロックを取得した。

グラフが表示されない場合はこちら

グラフの形としては、スコアと同じだが、実際にクロックがどのくらいまで上がっているか確認できる。

7950Xは、最大で平均5.26GHzまで上がっていて、これまたなかなかすさまじい。

12900KもAll Core Boostの限界の4.9GHzに達している。



さて、最後にx265でもCinebenchと同じように電力効率を見てみる。

横軸に先ほどの動作周波数、縦軸にはエンコードに使用した電力[J] (コアのみの平均電力[W] × 経過時間 [s])を取ってみる。

ただ、集計の方法がある程度雑なのを割り引いてみる必要がある(正確にやるならクロックを固定したほうがよさそう)。

グラフが表示されない場合はこちら

相変わらず、7950Xの5.1GHz以上、12900Kの4.8GHz以上はグラフの傾きがなかなかすごいことになっていて、電力効率は悪そう…。



というわけで、データの収集や集計にだいぶ時間がかかってしまったが、PPT/PL値を変化させたときの性能の変化や、実際のCPUコア部分の消費電力や、そのときの効率もチェックしてみた。

やはりというべきか、最上位のCPUである7950Xや12900Kはかなりぎりぎりまでクロックを引っ張った仕様になっていることが改めて確認できたと思う。

そのため、多少PPT枠を下げていっても、性能への影響は小さいようだ。

このあたりは個人的な感覚になってしまうが、7950Xの場合は140Wぐらいまでは下げても性能の下げ幅は1割以下な場合がほとんどで、ほとんど体感できる変化はなさそう。

そのうえ、CPU温度はかなり下がり、ファンの速度の設定にもよるがだいぶ静音化できるので、個人的には常用するには120W~140W前後がいいのかなと思った。

さんざん言われていることであるが、各PCの冷却環境等に合わせて、PPTや温度上限を調整するのがよさそう、というふうに思う。

スポンサーサイト



コメントの投稿

非公開コメント

プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先: rigaya34589@live.jp
github twitter

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutl 出力プラグイン
x264guiEx 3.xx
- x264を使用したH264出力
- x264guiExの導入紹介動画>
- x264guiExの導入
- x264guiExのエラーと対処方法>
- x264.exeはこちら>

x265guiEx
- x265を使用したH.265/HEVC出力
- x265guiExの導入>
- x265.exeはこちら>

QSVEnc + QSVEncC
- QuickSyncVideoによるHWエンコード
- QSVEnc 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC
- NVIDIAのNVEncによるHWエンコード
- NVEnc 導入/使用方法>
- NVEncCオプション一覧>

VCEEnc + VCEEncC
- AMDのVCE/VCNによるHWエンコード
- VCEEnc 導入/使用方法>
- VCEEncCオプション一覧>

svtAV1guiEx
- SVT-AV1によるAV1出力
- svtAV1guiExの導入>
- SVT-AV1単体はこちら>

VVenCguiEx
- VVenCによるVVC出力
- VVenCguiExの導入>

ffmpegOut
- ffmpegを使用した出力
- ffmpegOutの導入>


○Aviutl フィルタプラグイン
自動フィールドシフト (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: aji様

clcufilters 
- OpenCL/CUDAのGPUフィルタ集
- 対応フィルタの一覧等はこちら

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX512対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: まじぽか太郎様

PMD_MT
- SSE2~AVX512による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
Amatsukaze改造版
- AmatsukazeのAV1対応版

tsreplace
- tsの映像のみを置き換えて圧縮

rkmppenc
- Rockchip系SoCのhwエンコーダ

fawutil
- FAW(FakeAACWave)⇔aac変換
- 二重音声の取り扱いにも対応

x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定
- これまでの測定結果はこちら

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)
SVT-AV1 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR