比較環境
比較する環境は以下の通り。今回かなりたくさんの環境と設定で比較したので疲れた…。
まずはIntel環境。
今回はi9 12900Kがどこまで性能を出せるかということで、PL1=PL2=241Wに設定している。特にオーバークロック設定はなしなので最大5.3GHz, All core turbo 4.9GHz。
i9 12900Kの「8P+8E 空冷低電圧化」は
前回記事の低電圧化を行ったもの。
「8P+0E 空冷」はBIOSからE-coreをすべて無効としてP-coreのみのCPUとしたもの。「8P+8E 空冷」と比べることで、E-coreが実際のところどのくらい性能に効いているのかわかると思う。
CPU | i9 12900K | i7 11700K | i9 7980XE |
---|
8P+8E 空冷低電圧化 | 8P+8E 空冷 | 8P+0E 空冷 | Unlimited | 定格 | PL240W | 定格 |
---|
コア数 | 8P+8E 24T | 8P+0E 16T | 8C/16T | 18C/36T | 18C/36T |
L2 Cache | 14MB | 10MB | 4MB | 18MB |
L3 Cache | 30MB | 16MB | 24.75MB |
Boost | 5.2GHz | 4.9GHz | 4.5GHz |
AVX512 | | Auto | 4.2Ghz | Auto |
OC | Offset -0.13V | Default | Default | Default | OC | Default |
Core Voltage | Auto | Auto | Adaptive 1.175+0.01 | Auto |
PL1 | 241W | Unlimited | 125W | 240W | 165W |
PL2 | 241W | Unlimited | 251W | |
tau | 56s | Unlimited | 56s | |
IccMax | Unlimited | Unlimited | Auto | |
Uncore | ? MHz (Auto) | 4100MHz | 3000MHz | 2000MHz |
メモリ | DDR4-3600 2ch | DDR4-3600 2ch | DDR4-3600 4ch |
メモリ容量 | 8GBx4 | 16GBx2 | 8GBx4 |
タイミング | 16-19-19-39-1 | 18-22-22-45-2 | 16-19-19-39-1 |
メモリ FCLK | Gear1 | Gear1 | Gear2 | |
マザー | MSI MAG Z690 TOMAHAWK WIFI DDR4 | Gigabyte Z590I AORUS ULTRA (F5a) | Asrock X299 OC Formula |
冷却 | Noctua NH-D14 | Thermaltake Water 3.0 Riing Edition 280 | Corsair iCUE H150i RGB PRO |
電源 | Seasonic FOCUS PX-750 | Seasonic SS-620GB | Seasonic FOCUS PX-750 |
ケース | Thermaltake Core V71 | Phanteks Evolv Shift X | Thermaltake Core V71 |
OS | Windows 11 | Windows 11 | Windows 11 |
次にAMD環境。5950XのPBO+COは、PBOを有効にしてさらにCurve Optimizerを使って性能向上を図ったもの。PPTは200W。
「R7 5800X (偽)」は5950XをBIOSから1CCDのみ有効とし8コアCPUとして疑似5800Xとして動作させたもの。
CPU | R9 5950X | R7 5800X (偽) | R7 3700X |
---|
定格 | PBO+CO | 定格 | 定格 |
---|
コア数 | 16C/32T | 8C/16T | 8C/16T |
L2 Cache | 8MB | 4MB | 4MB |
L3 Cache | 64MB | 32MB | 32MB |
Boost | 5.0GHz | 5.0GHz | 4.4GHz |
OC | Default | PBO+CO | Default | Default |
Core Voltage | Auto | Auto | Auto | Auto |
PPT | 142W | 200W | 142W | 88W |
TDC/IccMax | 95A | 150A | 95A | 60A |
EDC | 140A | 190A | 140A | 90A |
Offset | | +200MHz | | |
CO | | -10/-15/-25 | | |
Uncore | 1800MHz | 1800MHz | 1800MHz |
メモリ | DDR4-3600 2ch | DDR4-3600 2ch | DDR4-3600 2ch |
メモリ容量 | 16GBx2 | 16GBx2 | 8GBx2 |
タイミング | 19-20-20-40-1 | 19-20-20-40-1 | 20-23-23-45-1 |
メモリ FCLK | 1:1 | 1:1 | 1:1 |
マザー | Gigabyte B550 AORUS Master | Gigabyte B550 AORUS Master | Asrock X570 Steel Legend |
冷却 | Fractal Design Celsius+ S28 Prisma | Fractal Design Celsius+ S28 Prisma | Noctua NH-D14 |
電源 | Seasonic FOCUS PX-750 | Seasonic FOCUS PX-750 | ENERMAX EPM600AWT |
ケース | Fractal Design Define 7 Compact LightTG | Fractal Design Define 7 Compact LightTG | Antec P100 |
OS | Windows 11 | Windows 11 | Windows 11 |
使用ソフト下記の通り。Rocketlakeのベンチマーク時からいくつかバージョンを更新している。
Cinebench R15, R20, R23
7zip 19.00
Aviutl 1.00 / x264guiEx 2.68 / x265guiEx 3.102 / svtav1guiEx 0.07
x264 rev3075 x64
x265 3.5+13 x64
y-cruncher 0.7.8 9507
Cinebench R23, R20, R15
Cinebench R23。今回から、マルチスレッドのほうは10分実行して平均をとるモードを使用している。
12900Kは5950Xの定格をしっかり上回る性能で、まあ12900Kはこのためにある製品といっても過言ではなさそう。ただし、PBOを使用した5950Xには及ばない感じ。
過去のIntel製品と比べると4年前のCore-Xシリーズの7980XE(18コア)やわずか半年前のRocketlake(11700K)を完全に過去のものとする性能で、なんと11700Kの倍以上のスコアとなっている。また、12900KのE-core無効時を見ると、それでも11700Kの1.5倍になっていて、GoldenCoveコア(P-core)がいかに強化されているかがうかがえる。
E-core無効と有効とを比べるとスコアが約1.5倍になっていて、E-coreの寄与が大きいこともわかる。
シングルスレッドのほうを見ると、12900Kのシングルスレッドはついに2000を超えており、Rocketlakeからは大きくスコアが向上している。12900Kのクロックの高さも相まってシングルスレッドは5950Xにも圧勝していて、GoldenCoveコアの優秀さが発揮されている。
E-core無効とするとシングルスレッドが落ちてしまうのがちょっとよくわからないが、E-core有効時はE-coreで動作していたわずかなバックグラウンド処理がP-coreで動く分、クロックが上がりにくくなるのかもしれない。

Cinebench R20。だいたいの傾向はR23と同じ。

Cinebench R15。
R20/R23と比べると、なぜかi9 12900Kのスコアが少し悪い。12900Kは5950X定格の近いところまで伸びているが、やや低いことがわかる。低電圧化でスコアが落ちてしまうのは謎。

7zip 19.00
7zipはなぜかRyzenが圧倒的に強く(キャッシュの量とかの問題?)、Rocketlakeからはだいぶ良くなったとはいえ12900Kは5950Xに完敗。なんならついでに7980XEにも追いつけていない。キャッシュ量とかP-coreの数が重要なテストなのだろうか?
decompressはE-coreの有無でかなりスコアに差が出る一方で、compressのほうはほとんど差がないのも面白い。

y-cruncher 0.7.8 9507
SIMD-fpを酷使しつつメモリ帯域も重要とされるy-cruncher。この表だけ単位が計算時間なので値が小さいほど速い。
ここではAVX512が使用でき、メモリ4chの7980XEがトップ。AVX512が使えるはずのRocketlakeがなぜかいまいちなのだが、それと比べると12900Kは大幅に高速化している。それでも、5950Xには及ばない感じ。
ただ、他所のベンチマークを見ると、このアプリではDDR5効果が大きいらしいので、DDR5使用なら12900Kはもっと頑張れるのかもしれない。

x264
さて、ここからが本題のx264。グラフがとても長いのは許してほしい。
Aviutlでmpeg2 1080p 5203frame(sample_movie_1080p.mpg)をlwinput.auiで読み込み、x264guiExで出力。
基本的に12900Kは定格のRyzen 5950Xと同等ぐらいのようで、プリセットによって微妙に速かったり遅かったりしている。ただ、PBO有効の5950Xには及ばない模様(といってもさほど大きな差ではない)。
E-core無効時と比較するとultrafastを除き大きな速度差があり、E-coreの効果が大きいことが確認できる。
Rocketlake(11700K)は大変悲しい感じで、重めのプリセットでは2倍弱の差をつけられている。まあ半年でAlderlakeが出るのがわかっていたとはいえ、ここまで差があると存在意義が…。

x265
次にx265 8bit。Aviutlでmpeg2 1080p 5203frame(sample_movie_1080p.mpg)をlwinput.auiで読み込み、x265guiExで出力。
これもほぼ傾向はx264と同じだが、12900Kがx264と比べるとやや伸びが悪い印象。E-core無効時と比較するとx264の時と比べて性能差が小さく、E-coreがx265を苦手としているのかもしれない。その結果、特に軽めのプリセットではより5950X有利という感じに見える。また、オーバークロックした7980XEが結構頑張っていて、12900Kの近いところまで来ている。

x265 10bit。これも8bitと同様の傾向。

SVT-AV1
svt-av1(8bit)。Aviutlでmpeg2 1080p 5203frame(sample_movie_1080p.mpg)をlwinput.auiで読み込み、svtAV1guiExで出力。
これは比較的Alderlake 12900Kが強く、ほとんどのプリセットでPBO有効の5950Xよりも速い結果になっている。

最後にsvt-av1(10bit)。P4でも2fpsを超え、12900Kがかなり速い。すべてのプリセットでPBO有効の5950Xを上回っている。

終わりに
というわけでエンコードを中心に12900Kの性能をチェックしてみた。
10nmの躓きにより、Intelは2015年のBroadwellから6年(!)近く14nmを使い倒したわけだが、やっと14nmにおさらばし、10+++(Intel7)プロセスのAlderlakeを発売した。
AlderlakeはP-core + E-coreというハイブリッドアーキテクチャに挑戦しつつ、P-coreを大幅に強化していて、Ryzenに押されっぱなしだったIntelの反撃にふさわしいものとなっていると思う。ここ最近あまり新しみのなかったIntel CPUが一気に動き出した感じがするCPUだ。
実際にベンチマークやエンコードでもDDR4環境ながらかなり優秀な印象で、P-coreの圧倒的なシングルスレッド性能が確認できた。やはりCPUにとってシングルスレッド性能はすべての基礎なので、これが大幅に向上しているのは素晴らしいと思う。また、多くの処理でマルチスレッドでもより価格の高い5950X定格を上回る、ないし近いところまで来ている。
問題はその性能を達成するために電力喰いでとても熱いところ。実際にCinebenchなど全コアが100%で稼働する場合には大型空冷では冷やしきれずThermal Throttolingが発生する場面もあった。ただし、PL1=241Wだからといって、実際いつもそこまで使っているかというとそうでもない。例えば、i9 12900K 空冷低電圧化のx265 slowerのテスト中のCPU温度、電力、動作周波数をチェックしたらこんな感じになった。

i9 12900Kの動作周波数はほぼ4.9GHzに張り付いていて、ぎりぎりThermal Throttlingは発生していない。消費電力は後半は一時的に200Wに達しているものの、平均では177W。まあ十分爆熱だが241Wという数字から受ける印象ほどではないかも。
ただ、本来E-coreはマルチスレッド時の電力効率を上げるために搭載したはずで、むしろ低電力で回したときのほうが有効なような気もする。どうも12900Kは、5950X定格を意地でも上回るために無茶している感があるので、今度はPL1=125W設定での速度をチェックしてみたい。
E-coreの効果については、もちろん単コアの性能はP-coreよりは性能は相応に低いものの、マルチスレッドが効く場面ではそこそこの性能の上乗せになっていることが確認できた。マルチスレッド性能の底上げやバックグラウンドタスク等の軽量な処理を効率よくさばいてくれるという意味でも、今後E-core数がより増えていくともっと面白くなりそう。
また、発売日にDDR5難民になってDDR4マザーを買ってしまったので、今回はDDR4環境となった。DDR5はメモリ帯域が大幅に上昇するだけでなく、マルチスレッドが効く場面で効果的ということなので、エンコードでも効果がそこそこあるのかもしれず、12900Kの性能をもっと引き出せるのかもしれない。(まあ試せないけど…
…Rocketlakeは…出てから半年したら圧倒的な性能で後続に上回られたCPUとして黒歴史入りしそうですね…。
この子はどうしたものか…。まあ7980XE環境を12900Kと置き換えで解体してしまったので、今後はAVX512検証環境としてしばらく使わせていただきます…。