Alderlake i9 12900K ベンチマーク

Alderlake i9 12900KでPCを組み、ベンチマークをとって他のPCと比べてみた。

注意点は2点。
・i9 12900Kだが、DDR4使用
・i9 12900Kだが、空冷使用なので200~210Wが続くとThermal throttolingが発生

こうなった理由については以前の記事をチェックしてほしい。

なので、DDR5を使用したり、簡易水冷で冷却を強化することでより性能が向上する可能性があることに注意しながら見てみてほしい。

i9_12900K_cpuz_8P8E.png





比較環境



比較する環境は以下の通り。今回かなりたくさんの環境と設定で比較したので疲れた…。

まずはIntel環境。

今回はi9 12900Kがどこまで性能を出せるかということで、PL1=PL2=241Wに設定している。特にオーバークロック設定はなしなので最大5.3GHz, All core turbo 4.9GHz。

i9 12900Kの「8P+8E 空冷低電圧化」は前回記事の低電圧化を行ったもの。

「8P+0E 空冷」はBIOSからE-coreをすべて無効としてP-coreのみのCPUとしたもの。「8P+8E 空冷」と比べることで、E-coreが実際のところどのくらい性能に効いているのかわかると思う。

CPUi9 12900Ki7 11700Ki9 7980XE
8P+8E
空冷低電圧化
8P+8E
空冷
8P+0E
空冷
Unlimited定格PL240W定格
コア数8P+8E
24T
8P+0E
16T
8C/16T18C/36T18C/36T
L2 Cache14MB10MB4MB18MB
L3 Cache30MB16MB24.75MB
Boost5.2GHz4.9GHz4.5GHz
AVX512Auto4.2GhzAuto
OCOffset
-0.13V
DefaultDefaultDefaultOCDefault
Core VoltageAutoAutoAdaptive
1.175+0.01
Auto
PL1241WUnlimited125W240W165W
PL2241WUnlimited251W
tau56sUnlimited56s
IccMaxUnlimitedUnlimitedAuto
Uncore? MHz (Auto)4100MHz3000MHz2000MHz
メモリDDR4-3600 2chDDR4-3600 2chDDR4-3600 4ch
メモリ容量8GBx416GBx28GBx4
タイミング16-19-19-39-118-22-22-45-216-19-19-39-1
メモリ FCLKGear1Gear1Gear2
マザーMSI MAG
Z690 TOMAHAWK
WIFI DDR4
Gigabyte
Z590I AORUS
ULTRA (F5a)
Asrock
X299 OC Formula
冷却Noctua
NH-D14
Thermaltake
Water 3.0 Riing
Edition 280
Corsair
iCUE H150i RGB PRO
電源Seasonic
FOCUS PX-750
Seasonic
SS-620GB
Seasonic
FOCUS PX-750
ケースThermaltake
Core V71
Phanteks
Evolv Shift X
Thermaltake
Core V71
OSWindows 11Windows 11Windows 11


次にAMD環境。5950XのPBO+COは、PBOを有効にしてさらにCurve Optimizerを使って性能向上を図ったもの。PPTは200W。

「R7 5800X (偽)」は5950XをBIOSから1CCDのみ有効とし8コアCPUとして疑似5800Xとして動作させたもの。

CPUR9 5950XR7 5800X (偽)R7 3700X
定格PBO+CO定格定格
コア数16C/32T8C/16T8C/16T
L2 Cache8MB4MB4MB
L3 Cache64MB32MB32MB
Boost5.0GHz5.0GHz4.4GHz
OCDefaultPBO+CODefaultDefault
Core VoltageAutoAutoAutoAuto
PPT142W200W142W88W
TDC/IccMax95A150A95A60A
EDC140A190A140A90A
Offset+200MHz
CO-10/-15/-25
Uncore1800MHz1800MHz1800MHz
メモリDDR4-3600 2chDDR4-3600 2chDDR4-3600 2ch
メモリ容量16GBx216GBx28GBx2
タイミング19-20-20-40-119-20-20-40-120-23-23-45-1
メモリ FCLK1:11:11:1
マザーGigabyte
B550 AORUS Master
Gigabyte
B550 AORUS Master
Asrock
X570 Steel Legend
冷却Fractal Design
Celsius+ S28 Prisma
Fractal Design
Celsius+ S28 Prisma
Noctua
NH-D14
電源Seasonic
FOCUS PX-750
Seasonic
FOCUS PX-750
ENERMAX
EPM600AWT
ケースFractal Design
Define 7 Compact LightTG
Fractal Design
Define 7 Compact LightTG
Antec P100
OSWindows 11Windows 11Windows 11


使用ソフト
下記の通り。Rocketlakeのベンチマーク時からいくつかバージョンを更新している。

Cinebench R15, R20, R23
7zip 19.00
Aviutl 1.00 / x264guiEx 2.68 / x265guiEx 3.102 / svtav1guiEx 0.07
x264 rev3075 x64
x265 3.5+13 x64
y-cruncher 0.7.8 9507



Cinebench R23, R20, R15



Cinebench R23。今回から、マルチスレッドのほうは10分実行して平均をとるモードを使用している。

12900Kは5950Xの定格をしっかり上回る性能で、まあ12900Kはこのためにある製品といっても過言ではなさそう。ただし、PBOを使用した5950Xには及ばない感じ。

過去のIntel製品と比べると4年前のCore-Xシリーズの7980XE(18コア)やわずか半年前のRocketlake(11700K)を完全に過去のものとする性能で、なんと11700Kの倍以上のスコアとなっている。また、12900KのE-core無効時を見ると、それでも11700Kの1.5倍になっていて、GoldenCoveコア(P-core)がいかに強化されているかがうかがえる。

E-core無効と有効とを比べるとスコアが約1.5倍になっていて、E-coreの寄与が大きいこともわかる。

シングルスレッドのほうを見ると、12900Kのシングルスレッドはついに2000を超えており、Rocketlakeからは大きくスコアが向上している。12900Kのクロックの高さも相まってシングルスレッドは5950Xにも圧勝していて、GoldenCoveコアの優秀さが発揮されている。

E-core無効とするとシングルスレッドが落ちてしまうのがちょっとよくわからないが、E-core有効時はE-coreで動作していたわずかなバックグラウンド処理がP-coreで動く分、クロックが上がりにくくなるのかもしれない。

i9_12900K_20211108_benchmark_cinebench_r23.png



Cinebench R20。だいたいの傾向はR23と同じ。

i9_12900K_20211108_benchmark_cinebench_r20.png



Cinebench R15。

R20/R23と比べると、なぜかi9 12900Kのスコアが少し悪い。12900Kは5950X定格の近いところまで伸びているが、やや低いことがわかる。低電圧化でスコアが落ちてしまうのは謎。

i9_12900K_20211108_benchmark_cinebench_r15.png



7zip 19.00



7zipはなぜかRyzenが圧倒的に強く(キャッシュの量とかの問題?)、Rocketlakeからはだいぶ良くなったとはいえ12900Kは5950Xに完敗。なんならついでに7980XEにも追いつけていない。キャッシュ量とかP-coreの数が重要なテストなのだろうか?

decompressはE-coreの有無でかなりスコアに差が出る一方で、compressのほうはほとんど差がないのも面白い。

i9_12900K_20211108_benchmark_7zip.png



y-cruncher 0.7.8 9507



SIMD-fpを酷使しつつメモリ帯域も重要とされるy-cruncher。この表だけ単位が計算時間なので値が小さいほど速い。

ここではAVX512が使用でき、メモリ4chの7980XEがトップ。AVX512が使えるはずのRocketlakeがなぜかいまいちなのだが、それと比べると12900Kは大幅に高速化している。それでも、5950Xには及ばない感じ。

ただ、他所のベンチマークを見ると、このアプリではDDR5効果が大きいらしいので、DDR5使用なら12900Kはもっと頑張れるのかもしれない。

i9_12900K_20211108_benchmark_y_cruncher.png



x264



さて、ここからが本題のx264。グラフがとても長いのは許してほしい。

Aviutlでmpeg2 1080p 5203frame(sample_movie_1080p.mpg)をlwinput.auiで読み込み、x264guiExで出力。

基本的に12900Kは定格のRyzen 5950Xと同等ぐらいのようで、プリセットによって微妙に速かったり遅かったりしている。ただ、PBO有効の5950Xには及ばない模様(といってもさほど大きな差ではない)。

E-core無効時と比較するとultrafastを除き大きな速度差があり、E-coreの効果が大きいことが確認できる。

Rocketlake(11700K)は大変悲しい感じで、重めのプリセットでは2倍弱の差をつけられている。まあ半年でAlderlakeが出るのがわかっていたとはいえ、ここまで差があると存在意義が…。

i9_12900K_20211108_benchmark_x264.png



x265



次にx265 8bit。Aviutlでmpeg2 1080p 5203frame(sample_movie_1080p.mpg)をlwinput.auiで読み込み、x265guiExで出力。

これもほぼ傾向はx264と同じだが、12900Kがx264と比べるとやや伸びが悪い印象。E-core無効時と比較するとx264の時と比べて性能差が小さく、E-coreがx265を苦手としているのかもしれない。その結果、特に軽めのプリセットではより5950X有利という感じに見える。また、オーバークロックした7980XEが結構頑張っていて、12900Kの近いところまで来ている。

i9_12900K_20211108_benchmark_x265_8bit.png



x265 10bit。これも8bitと同様の傾向。

i9_12900K_20211108_benchmark_x265_10bit.png



SVT-AV1



svt-av1(8bit)。Aviutlでmpeg2 1080p 5203frame(sample_movie_1080p.mpg)をlwinput.auiで読み込み、svtAV1guiExで出力。

これは比較的Alderlake 12900Kが強く、ほとんどのプリセットでPBO有効の5950Xよりも速い結果になっている。

i9_12900K_20211108_benchmark_svtav1_8bit.png



最後にsvt-av1(10bit)。P4でも2fpsを超え、12900Kがかなり速い。すべてのプリセットでPBO有効の5950Xを上回っている。

i9_12900K_20211108_benchmark_svtav1_10bit.png



終わりに



というわけでエンコードを中心に12900Kの性能をチェックしてみた。

10nmの躓きにより、Intelは2015年のBroadwellから6年(!)近く14nmを使い倒したわけだが、やっと14nmにおさらばし、10+++(Intel7)プロセスのAlderlakeを発売した。

AlderlakeはP-core + E-coreというハイブリッドアーキテクチャに挑戦しつつ、P-coreを大幅に強化していて、Ryzenに押されっぱなしだったIntelの反撃にふさわしいものとなっていると思う。ここ最近あまり新しみのなかったIntel CPUが一気に動き出した感じがするCPUだ。

実際にベンチマークやエンコードでもDDR4環境ながらかなり優秀な印象で、P-coreの圧倒的なシングルスレッド性能が確認できた。やはりCPUにとってシングルスレッド性能はすべての基礎なので、これが大幅に向上しているのは素晴らしいと思う。また、多くの処理でマルチスレッドでもより価格の高い5950X定格を上回る、ないし近いところまで来ている。

問題はその性能を達成するために電力喰いでとても熱いところ。実際にCinebenchなど全コアが100%で稼働する場合には大型空冷では冷やしきれずThermal Throttolingが発生する場面もあった。ただし、PL1=241Wだからといって、実際いつもそこまで使っているかというとそうでもない。例えば、i9 12900K 空冷低電圧化のx265 slowerのテスト中のCPU温度、電力、動作周波数をチェックしたらこんな感じになった。

Aviutl_benchmark_20211110_x265_slower_i9_12900K.png

i9 12900Kの動作周波数はほぼ4.9GHzに張り付いていて、ぎりぎりThermal Throttlingは発生していない。消費電力は後半は一時的に200Wに達しているものの、平均では177W。まあ十分爆熱だが241Wという数字から受ける印象ほどではないかも。

ただ、本来E-coreはマルチスレッド時の電力効率を上げるために搭載したはずで、むしろ低電力で回したときのほうが有効なような気もする。どうも12900Kは、5950X定格を意地でも上回るために無茶している感があるので、今度はPL1=125W設定での速度をチェックしてみたい。



E-coreの効果については、もちろん単コアの性能はP-coreよりは性能は相応に低いものの、マルチスレッドが効く場面ではそこそこの性能の上乗せになっていることが確認できた。マルチスレッド性能の底上げやバックグラウンドタスク等の軽量な処理を効率よくさばいてくれるという意味でも、今後E-core数がより増えていくともっと面白くなりそう。

また、発売日にDDR5難民になってDDR4マザーを買ってしまったので、今回はDDR4環境となった。DDR5はメモリ帯域が大幅に上昇するだけでなく、マルチスレッドが効く場面で効果的ということなので、エンコードでも効果がそこそこあるのかもしれず、12900Kの性能をもっと引き出せるのかもしれない。(まあ試せないけど…



…Rocketlakeは…出てから半年したら圧倒的な性能で後続に上回られたCPUとして黒歴史入りしそうですね…。

この子はどうしたものか…。まあ7980XE環境を12900Kと置き換えで解体してしまったので、今後はAVX512検証環境としてしばらく使わせていただきます…。
スポンサーサイト



コメントの投稿

非公開コメント

No title

評価記事お疲れ様です


結果を見ると私にとってはP-Core Only SKU + DDR4が無難かな? と思いました
メインタスクがx265 8bitな事もありますし、OSも10のままいけそうですからね

……ぶっちゃけるとライバルに勝ち越せたFXのような印象です、はいw

No title

検証お疲れ様です

ゲームベンチ関係はDDR4とDDR5でさほど変わらないとかレイテンシの詰めたDDR4環境の方が速いとか聞きますね
エンコード関係の性能も気になるところではありますね

No title

> ライバルに勝ち越せたFX
たしかにそんな感じです!

ただ、最近はTDPのインフレがすごすぎて、当時と比べるとあまり驚かなくなってしまった自分がいます…。

> ゲームベンチ関係はDDR4とDDR5でさほど変わらないとかレイテンシの詰めたDDR4環境の方が速いとか聞きますね
そうですね、レイテンシが効くか帯域が効くか、アプリによって結構変わりそうです。

いま出ているDDR5は出始めのもっとも遅いもので今後どんどん高速なものが出てくるのだろうと思うとなかなか悩ましいですね。

DDR5-6000とかで検証しているところもあるようですが、そういうのが普通に変えるのはだいぶ先でしょうし。

No title

興味深い検証ありがとうございます。まだ専門サイトのベンチでは、P-Coreに焦点を当てた検証が少なく、貴重な情報でした。可能であれば、E-Core限定のベンチも面白いかもしれません。

Re: No title

コメントありがとうございます。

E-core関連のテストもやってみました!
https://rigaya34589.blog.fc2.com/blog-entry-1397.html

Re:Re: No title

>E-core関連のテストもやってみました!
おおっ!素晴らしい!ありがとうございます。メディアの検証では、今のところここまでやっていらっしゃるところは見当たらなかったので、大変貴重だと思います。専門メディアよりも素晴らしい検証。
プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先: rigaya34589@live.jp
github twitter

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutl 出力プラグイン
x264guiEx 3.xx
- x264を使用したH264出力
- x264guiExの導入紹介動画>
- x264guiExの導入
- x264guiExのエラーと対処方法>
- x264.exeはこちら>

x265guiEx
- x265を使用したH.265/HEVC出力
- x265guiExの導入>
- x265.exeはこちら>

QSVEnc + QSVEncC
- QuickSyncVideoによるHWエンコード
- QSVEnc 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC
- NVIDIAのNVEncによるHWエンコード
- NVEnc 導入/使用方法>
- NVEncCオプション一覧>

VCEEnc + VCEEncC
- AMDのVCE/VCNによるHWエンコード
- VCEEnc 導入/使用方法>
- VCEEncCオプション一覧>

svtAV1guiEx
- SVT-AV1によるAV1出力
- svtAV1guiExの導入>
- SVT-AV1単体はこちら>

VVenCguiEx
- VVenCによるVVC出力
- VVenCguiExの導入>

ffmpegOut
- ffmpegを使用した出力
- ffmpegOutの導入>


○Aviutl フィルタプラグイン
自動フィールドシフト (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: aji様

clfilters 
- OpenCLベースの複数のGPUフィルタ集
- 対応フィルタの一覧等はこちら

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX512対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: まじぽか太郎様

PMD_MT
- SSE2~AVX512による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
Amatsukaze改造版
- AmatsukazeのAV1対応版

rkmppenc
- Rockchip系SoCのhwエンコーダ

x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定
- これまでの測定結果はこちら

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)
SVT-AV1 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR