Ryzen/Haswell/KabylakeでのSMT(HTT)の効果
タイトルの通り、SMT/HTTがどのくらい効果があるのかを見てみた。BIOSでオン/オフを切り替えて比較。
比較環境
※R7 1700のみ、Windowsの電源プランは高パフォーマンス。
SMT/HTTはBIOSでオン/オフを切り替えて比較。
まずはCinebench 15から。

SMT offだと、R7 1700@3.6GHzと5960X@3.6GHzがほぼ同スコアなのに対し、SMTをonにするとR7 1700@3.6GHzのスコアが大きく延びて、5960X@3.6GHzを大きく上回る結果になった。
RyzenのFPUは128bitのFADDx2 + FMULx2という構成なので、1スレッドだと余力がまだまだあり、SMTで2スレッド放り込むとその真価を発揮できる、というところだろうか。
x264エンコード(8bit)。
環境は
Aviutl 1.00
x264guiEx 2.50
x264 2762 x64 (8bit)
lwinput.aui
入力ファイル
sample_movie_1080p.mpg (MPEG2, 1920x1080p, 29.97fps, 5203frame, 2分53秒, 10.61mbps)
オプションは以下の4通り。
--preset faster
--preset medium
--preset slow
--preset slower

ほとんどのCPUで、slowerやslowでは、SMT onのほうが速い一方、mediumやfasterではSMT offのほうがやや遅いという結果に。
slowやslowerで見ると、SMTを有効にしたことによる速度の伸び率は、7700K > R7 1700 > 5960Xといった感じで、7700Kが特にSMTの効果が大きい印象。やはり、Haswell→Skylakeでの整数SIMDの実行ユニット数追加が大きいのだろうか?
・整数加減算 2→3
・整数積算 1→2
・シフト 1→2
というか、Skylakeはなんでshuffle系もついでに増やしてくれなかったのやら…。
さて、次にx265。x265では10bitエンコもやってみた。x265はRyzenが苦手とされるが…。
環境は
Aviutl 1.00
x265guiEx 3.77
x265 2.3+22 x64 (8bit/10bit)
lwinput.aui
入力ファイル
sample_movie_1080p.mpg (MPEG2, 1920x1080p, 29.97fps, 5203frame, 2分53秒, 10.61mbps)
オプションは以下の4通り。
--crf 21 --preset fast
--crf 21 --preset medium
--crf 21 --preset slow


x264と異なり、presetに関係なく、SMTオンのほうが高速になった。
ざっと調べた感じ、Ryzenの整数SIMDは、
論理演算 128bitx4
加減算 128bitx3
飽和付き加減算 128bitx2
積算・積和算 128bitx1
シフト 128bitx1
最大最小 128bitx3
平均 128bitx2
shuffle系 128bitx2 (一部除く)
という感じの模様。
比較環境
CPU | Ryzen 7 1700 @ 3.6GHz | i7 5960X @ 3.6GHz | i7 5960X @ 4.2GHz | i7 7700K @ 4.8GHz |
コア数 | 8C/16T | 8C/16T | ← | 4C/8T |
定格 | 3.0GHz | 3.0GHz | ← | 4.2GHz |
Turbo | 3.7GHz | 3.5GHz | ← | 4.5GHz |
設定Clock | 3.6GHz | 3.6GHz | 4.2GHz | 4.8GHz |
設定電圧 | 1.225V | 1.100V | 1.164V | 1.296V |
設定Uncore | - | 3.6GHz | 3.8GHz | 4.4GHz |
メモリ | G.Skill F4-3400C16Q-16GRBD | Avexir AVD4U24001608G-4M | ← | Corsair CMK16GX4M2B4000C19R |
メモリ速度 | DDR4-2400, 2ch | DDR4-2400, 4ch | DDR4-2666, 4ch | DDR4-3600, 2ch |
メモリタイミング | 15-15-15-36 | 15-15-15-35 | 16-16-16-39-2 | 16-16-16-36-1 |
メモリ電圧 | 1.20V | 1.20V | 1.255V | 1.35V |
マザーボード | Asrock AB350 Pro4 (1.50) | Asrock Fatal1ty X99 Professional Gaming i7 | ← | Asrock Z270 Extreme4 |
SSD | Plextor PX-128M3 128GB | Plextor M8Pe 1TB (PX-1TM8PeY) | ← | Plextor M6 Pro (PX-256M6Pro) |
ケース | Antec P100 | Corsair Carbide 330R | ← | Antec P100 |
冷却 | 純正 (Wraith SPIRE) | Cooler Master Nepton 280L (簡易水冷 280mm) | ← | CRYORIG A80 (簡易水冷 280mm) |
電源 | Enermax EPM600AWT | Seasonic SS-760XP2 | ← | Seasonic SS-660XP2S |
OS | Win10 x64 | Win10 x64 | ← | Win10 x64 |
※R7 1700のみ、Windowsの電源プランは高パフォーマンス。
SMT/HTTはBIOSでオン/オフを切り替えて比較。
まずはCinebench 15から。

SMT offだと、R7 1700@3.6GHzと5960X@3.6GHzがほぼ同スコアなのに対し、SMTをonにするとR7 1700@3.6GHzのスコアが大きく延びて、5960X@3.6GHzを大きく上回る結果になった。
RyzenのFPUは128bitのFADDx2 + FMULx2という構成なので、1スレッドだと余力がまだまだあり、SMTで2スレッド放り込むとその真価を発揮できる、というところだろうか。
x264エンコード(8bit)。
環境は
Aviutl 1.00
x264guiEx 2.50
x264 2762 x64 (8bit)
lwinput.aui
入力ファイル
sample_movie_1080p.mpg (MPEG2, 1920x1080p, 29.97fps, 5203frame, 2分53秒, 10.61mbps)
オプションは以下の4通り。
--preset faster
--preset medium
--preset slow
--preset slower

ほとんどのCPUで、slowerやslowでは、SMT onのほうが速い一方、mediumやfasterではSMT offのほうがやや遅いという結果に。
slowやslowerで見ると、SMTを有効にしたことによる速度の伸び率は、7700K > R7 1700 > 5960Xといった感じで、7700Kが特にSMTの効果が大きい印象。やはり、Haswell→Skylakeでの整数SIMDの実行ユニット数追加が大きいのだろうか?
・整数加減算 2→3
・整数積算 1→2
・シフト 1→2
というか、Skylakeはなんでshuffle系もついでに増やしてくれなかったのやら…。
さて、次にx265。x265では10bitエンコもやってみた。x265はRyzenが苦手とされるが…。
環境は
Aviutl 1.00
x265guiEx 3.77
x265 2.3+22 x64 (8bit/10bit)
lwinput.aui
入力ファイル
sample_movie_1080p.mpg (MPEG2, 1920x1080p, 29.97fps, 5203frame, 2分53秒, 10.61mbps)
オプションは以下の4通り。
--crf 21 --preset fast
--crf 21 --preset medium
--crf 21 --preset slow


x264と異なり、presetに関係なく、SMTオンのほうが高速になった。
ざっと調べた感じ、Ryzenの整数SIMDは、
論理演算 128bitx4
加減算 128bitx3
飽和付き加減算 128bitx2
積算・積和算 128bitx1
シフト 128bitx1
最大最小 128bitx3
平均 128bitx2
shuffle系 128bitx2 (一部除く)
という感じの模様。
スポンサーサイト