x264の--threads

x264は--threadsでスレッド数を指定できる。デフォルト(0=自動)だと論理コア数×1.5がスレッド数になる。

で、実際のところ、スレッド並列でどのくらい速くなる?


x264が自動的に設定する論理コア数×1.5が最適で、少なくいとCPUが遊んで遅くなり、多くてもスレッド切り替えが多発してやや遅くなる、らしい。

i7 3770Kは論理8コアなので、自動設定では--threads 12。

じゃあ、ほかの--threadsを設定したらどうなるのか、比べてみる。



環境
Intel Core i7 3770K (4C/8T, 3.9GHz @ 1.05V)
メモリ DDR3-1600 9-9-9-24 16GB

Win7 x64
Aviutl 0.99m
x264 r2208 x64 8bit
x264guiEx 1.57

素材
H.264 1920x1080p 23.976fps 2154frames

Aviutl フィルタ無し

x264 オプション
--preset slow --crf 20 --qcomp 0.7 --aq-strength 0.4 --psy-rd 1:0.2 --min-keyint 4 --subme 9 --trellis 2



今回は--lookahead-threadsは気にせず自動設定にする。自動では--lookahead-threadsは--threadsの1/6(小数点以下切り捨て)になる。

--threadsを増やすと、ほかが同じ設定でも容量(ファイルサイズ)が大きくなる。確かに1%ほどビットレートが増加した。が、今回は気にしない事にする。




結果
x264_threads_fps
--threadsを1から増やしていくと、エンコード速度がかなり上がる。--threads 12~15あたりが最速。やはりスレッド数を増やしすぎると、少し遅くなるようだ。

--threads 1の時に対する倍率に直すとこんな感じ。
x264_threads_mul

--threads 1 のときと比べると、最大で4.16倍速くなった。

i7 3770Kは物理4コアなので、ハイパースレッディングも十分活用できていて、かなり効率がよい並列化なのでは?



というわけで、(今回のテストでは)スレッド数はデフォルトの自動設定でいい、つまり論理コア数×1.5がちょうど、ということが確認できた。

x264の並列化は素晴らしいです。

続きます。(こちら>>)
スポンサーサイト



コメントの投稿

非公開コメント

たいしたことじゃなくて申し訳ないです

PCで録画していたものがたまりすぎたので
そろそろ変換をしないと空き容量が危ないと思い、
x264での変換についていろいろ調べていたところ
こちらにたどりつきました。
大変参考になる考察をされていて助かります。

拝見しますと、12threadで4.16倍とのことですが、
メモリが潤沢にある場合、例えば、16GBとか32GBの場合、
あえて4threadずつ2つ並列に実行することで、
1つは3倍で、2つでさらに2倍となり、計6倍になるので、
12threadで1つずつ実行するより早く実行できる気がするのです。

さらにメモリがある場合は2threadずつ4つ並列に実行すれば、
1つが2倍、4つでさらに4倍の計8倍になるのでしょうか?

うまく表現できなくて恐縮ですが、
大変参考になりました。
こちらの実験があったからこそ気づくことができました。
ありがとうございました。

Re: たいしたことじゃなくて申し訳ないです

おっしゃるようにx264を複数立ち上げるという手もあり、全体としては速いかもしれないのですが、やはり一本の動画のエンコードが速いほうが嬉しいので…

また、エンコードする動画がその分必要になるので、あまり使い勝手が良くないかなあとも思います。

なんにせよ、興味を持っていただいたなら幸いです。
プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先: rigaya34589@live.jp
github twitter

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutl 出力プラグイン
x264guiEx 3.xx
- x264を使用したH264出力
- x264guiExの導入紹介動画>
- x264guiExの導入
- x264guiExのエラーと対処方法>
- x264.exeはこちら>

x265guiEx
- x265を使用したH.265/HEVC出力
- x265guiExの導入>
- x265.exeはこちら>

QSVEnc + QSVEncC
- QuickSyncVideoによるHWエンコード
- QSVEnc 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC
- NVIDIAのNVEncによるHWエンコード
- NVEnc 導入/使用方法>
- NVEncCオプション一覧>

VCEEnc + VCEEncC
- AMDのVCE/VCNによるHWエンコード
- VCEEnc 導入/使用方法>
- VCEEncCオプション一覧>

svtAV1guiEx
- SVT-AV1によるAV1出力
- svtAV1guiExの導入>
- SVT-AV1単体はこちら>

VVenCguiEx
- VVenCによるVVC出力
- VVenCguiExの導入>

ffmpegOut
- ffmpegを使用した出力
- ffmpegOutの導入>


○Aviutl フィルタプラグイン
自動フィールドシフト (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: aji様

clfilters 
- OpenCLベースの複数のGPUフィルタ集
- 対応フィルタの一覧等はこちら

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX512対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: まじぽか太郎様

PMD_MT
- SSE2~AVX512による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
Amatsukaze改造版
- AmatsukazeのAV1対応版

tsreplace
- tsの映像のみを置き換えて圧縮

rkmppenc
- Rockchip系SoCのhwエンコーダ

x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定
- これまでの測定結果はこちら

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)
SVT-AV1 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR