Rocketlake (i7 11700K) のQSV

前回のベンチマーク記事では、i7 11700KのCPU性能を見ていったけど、今度はQSVはどうなっているの、ということでチェックした。

Kabylake(Skylake改1)からCometlake(同改4)まではずっと第9.5世代内蔵GPUが使いまわされてきたけど、Rocketlakeではやっとのことで内蔵GPUの世代も更新されて、第12世代に更新された。コア自体は10nmのTigerlakeの移植ということで、QSVの世代もこれに準じるものとなっていて、画質面は期待できそう。

一方、EU数はTigerlakeの96EUに対して、わずか32EUの実装になっている。まあ、やはり14nmでは数を詰め込めなかった、ということなのだろうか。

内蔵GPU代表的なCPU
第7.5世代Haswell (HSW)
第8世代Broadwell (BDW)
第9世代Skylake (SKL)
第9.5世代Kabylake (KBL)
Coffelake
Cometlake
第10世代幻のCannonlake (CNL)
第11世代Icelake (ICL)
第12世代Tigerlake (TGL)
Rocketlake (RKL)




比較環境

比較したのは以下の環境。基本的にRocketlake以外のデータは去年のデータ(1)(2)と同じなので、いまとなっては古い環境もある。

x264
x265
nvenc
(1060)
nvenc
(2070)
QSV
(HSW)
QSV
(KBL)
QSV
(ICL)
QSV
(RKL)
vce
(Vega)
CPUi9 7980XEi3
4170
i7
7700K
i5
1035G7
i7
11700K
R3
3200G
GPU-GTX
1060
RTX
2070
HDG
4400
HDG
630
Iris
Plus
HDG
750
Vega8
ドライバ442.19505878707641912720.2.1
OSWin10 x64


使用ソフト
x264 r2988 x64
x265 3.3+2 x64
NVEncC 4.68 x64
QSVEncC 3.33 x64
QSVEncC 5.00β2 x64 (RKLのみ)
VCEEncC 5.04 x64

入力 (実写)
sample_movie_1080p.mpg
MPEG2 1920x1080 29.97fps 5203frame

入力 (アニメ)
sakura_op.mpg
MPEG1 1280x720 30fps 3501frame

使用コマンド
QSVEnc/NVEncについては、おそらく画質が一番高くなるであろうオプションを試した。x264/x265はきりがないのでpresetをそのまま使用している。

なお、x264/x265では、今回入れてない--tune ssimを入れてssimに最適化したエンコをすることでさらにssim的には改善の余地があることに注意。

x264 medium
--crf

x264 veryslow
--crf --preset veryslow

x265 medium
--crf

x265 veryslow
--crf --preset veryslow

x265 medium 10bit
--crf --input-depth 10 --output-depth 10

x265 veryslow 10bit
--crf --input-depth 10 --output-depth 10 --preset veryslow

nvenc H.264
--vbrhq 0 --vbr-quality --preset quality --weightp --bref-mode each --lookahead 32 --level 5.2

nvenc HEVC
--vbrhq 0 --vbr-quality --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6

nvenc HEVC 10bit
--vbrhq 0 --vbr-quality --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 --output-depth 10

nvenc HEVC + Bframes
--vbrhq 0 --vbr-quality --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 -b 3

nvenc HEVC 10bit + Bframes
--vbrhq 0 --vbr-quality --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 --output-depth 10 -b 3

qsv H.264
--la-icq --la-depth 60 -u 1

qsv HEVC
--icq -u 1 -c hevc

qsv HEVC 10bit
--icq -u 1 -c hevc --profile main10 --output-depth 10

vce H.264
--cqp :+2:+5 -u slow
--vbr -u slow

vce HEVC
--cqp :+2:> -u slow -c hevc
--vbr -u slow -c hevc



エンコード速度



まずは1080pのエンコード速度から。対象は実写のMPEG2 1920x1080 29.97fps 5203frame。

ssim_20210408_speed.png

Rocketlake(RKL)のQSVは、Kabylakeと比べるとH.264は遅くなっている一方、HEVCは速くなっている。

一方、Icelakeとの比較では、HEVCのslowはIcelakeより速いけど、mediumのほうは遅い。Rocketlakeは32EUで、Icelakeは64EUなので、もしかして結構遅くなったりするのかと思っていたけど、そんなことはなく、まあだいたい同じくらいみたいで安心した。

まあとりたてて速いわけでもないけど、そこそこの速度でエンコードできるようだ。



画質比較 (実写 1080p : SSIM)



縦軸SSIM:Allが高いほど画質がよく、横軸ビットレートが小さいほど圧縮できているので、左上にいればいるほど良いことになる。まあ、SSIMで画質を比べることについてもいろいろあるけど、たくさんのデータをグラフにするにはそのぐらいしかないので。

VMAFはもっと速く計算できるようになるまではやらないです。

まずはQSV同士の比較から。

クリックで拡大
ssim_20210408_sample_qsv.png

QSVはIcelake世代で大幅に圧縮比が向上し、高画質・高圧縮になったが、RocketlakeはIcelakeの線とほぼ重なっていて、同じぐらいのエンジンが実装されていることがわかる。CometlakeまでのデスクトップCPUには、ずっとKabylake世代のQSVが積まれていたので、デスクトップCPUとしては待ちに待った更新になっている。

一方で、Icelakeとほぼ同じということで、Icelake→Rocketlakeでは画質面での向上はないようだ(Rocketlake固有のオプション等を使えば別なのかもだが)

他のGPUやx264/x265と比較するとこんな感じ。

クリックで拡大
ssim_20210408_sample_qsv_others.png

NVEncのほうはQSVより大幅に速いが、一方でQSVのほうが画質面ではよさそう。

RocketlakeのQSVのHEVCはSSIMベースでは、x265のmedium程度の画質はあるみたいで、GPUのEUを演算に活用するHybrid型とはいえ、ソフトウェアエンコに迫っているということでなかなかすごいことだと思う。



画質比較 (アニメ 720p : SSIM)



圧縮しやすいアニメ映像だとまた傾向が変わることもあるので確認してみた。

まずはQSV同士の比較から。

クリックで拡大
ssim_20210408_sakura_qsv.png

これは傾向は変わらず、RocketlakeはKabylakeから大幅に性能が向上し、こちらではIcelakeとの比較でもごくわずかに良くなっているように見える。

クリックで拡大
ssim_20210408_sakura_qsv_others.png

アニメ絵に関してはやはりソフトウェアエンコのほうが高画質・高圧縮を達成できるようで、x265とはそれなりの差がある。NVEncとの差も少し縮んでいる。



画質・圧縮率の高いHWエンコをデスクトップにもたらしたRocketlake



Icelakeの登場からだいぶたってしまったが、Rocketlakeの登場によりKabylake世代のQSVで停滞していたデスクトップCPUにやっと新世代のQSVがもたらされた。

NVEncのように非常に高速というわけではないが、IcelakeのQSV同様にそこそこの速度でHWエンコとしては画質・圧縮率の高いHWエンコとなっていると思う。ソフトウェアエンコには及ばずとも比較できる範囲内に入ってきているのはなかなかすごいことだと思う。

ただ、やはりベンチマークでも書いたようにZen3に対してRocketlakeはCPU性能が劣勢で、値段も特に安くなく、消費電力はかなり高いので、わざわざRocketlakeを選ぶのか、というのが難点。

また、逆にQSV目当てでローエンドあたりを狙うとしても、今回のRocketlakeのラインアップにはCore i3以下がなく、そして微妙にアイドル電力も高い(らしい)というのもローエンドとしては気になるところになってしまっている。



QSVEncの開発がはかどる



Rocketlake/TigerlakeのQSVには、今回チェックした既存のエンコード機能のほかに、HEVC YUV422/YUV444エンコードやAV1 HWデコードなども追加されている。

QSVEncでは5.00beta1からこのあたりの機能への対応も進めていて、今回実機が手に入ったのでこのあたりがちゃんと使えるように実装していきたい。

やはり実機があって動くと実装作業も楽しくなってくる。

IntelがRocketlakeで無理して14nmへの逆移植に挑戦してくれたおかげで、Alderlakeまで待たずとも最新世代のQSV環境と高IPCでレスポンスのよい開発環境が手に入ったので、とても個人的な理由だけど、わりとありがたかった。
スポンサーサイト



コメントの投稿

非公開コメント

プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先: rigaya34589@live.jp
github twitter

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutl 出力プラグイン
x264guiEx 3.xx
- x264を使用したH264出力
- x264guiExの導入紹介動画>
- x264guiExの導入
- x264guiExのエラーと対処方法>
- x264.exeはこちら>

x265guiEx
- x265を使用したH.265/HEVC出力
- x265guiExの導入>
- x265.exeはこちら>

QSVEnc + QSVEncC
- QuickSyncVideoによるHWエンコード
- QSVEnc 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC
- NVIDIAのNVEncによるHWエンコード
- NVEnc 導入/使用方法>
- NVEncCオプション一覧>

VCEEnc + VCEEncC
- AMDのVCE/VCNによるHWエンコード
- VCEEnc 導入/使用方法>
- VCEEncCオプション一覧>

svtAV1guiEx
- SVT-AV1によるAV1出力
- svtAV1guiExの導入>
- SVT-AV1単体はこちら>

VVenCguiEx
- VVenCによるVVC出力
- VVenCguiExの導入>

ffmpegOut
- ffmpegを使用した出力
- ffmpegOutの導入>


○Aviutl フィルタプラグイン
自動フィールドシフト (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: aji様

clfilters 
- OpenCLベースの複数のGPUフィルタ集
- 対応フィルタの一覧等はこちら

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX512対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: まじぽか太郎様

PMD_MT
- SSE2~AVX512による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
Amatsukaze改造版
- AmatsukazeのAV1対応版

rkmppenc
- Rockchip系SoCのhwエンコーダ

x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定
- これまでの測定結果はこちら

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)
SVT-AV1 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR