NVEnc 4.25

English version of changelog>>

[NVEncC]
・読み込みにudp等のプロトコルを使用する場合に、正常に処理できなくなっていたのを修正。
4.22以降のバグ。



ダウンロード>>
ダウンロード (ミラー) >>
OneDriveの調子がいまいちの時はミラー(GDrive)からどうぞ。同じものです。

ソースはこちら>>


スポンサーサイト



コメントの投稿

非公開コメント

初心者の者ですが…

更新ありがとうございます。私はAviUtlを導入しようとしている、動画編集初心者です。本当に初歩的なことを聞きますが、このプログラムはどういった機能をを拡張するのでしょうか?最初はx264guiExと間違えてダウンロードしたのですが、拡張出力が増えてなくておかしいなと思っていました。こんなド初心者にもわかるような解説をどうかよろしくお願いいたします。
後、このプログラムはこのままAviUtlに入れてもいいでしょうか?そこもよろしくお願いします。

Re: 初心者の者ですが…

NVENCというHWエンコーダを使用してH.264/HEVCなどで出力する拡張です。

導入方法は、x264guiExとさほど変わらないものとなっています。

No title

最近NvEncの存在を知り、最近使わせていただきました。
そこで質問なのですが、私の環境ではVideoEngineLoadが最大でも7%ほどしか使用されません。
これが見る値が違っているのか、仕様なのか、改善方法があるのか教えてください。

CPU:15-8400
グラボ:GTX 1060 6GB
メモリ:8GB

Re: No title

Video Engine Loadが低く、速度が出ないということでしょうか?

指標として見るのはVideo Engine Loadでよいと思います。

コマンドライン版のNVEncCですと、HWデコードなどを利用することで、Video Engine Loadを100%近くまでもっていくことができますが、Aviutlから使用する場合、CPU側の処理(デコードやフィルタリング)やGPUへのデータの転送が原因で思ったように速度が出ないことがあります。

それでも7%はちょっと低いかな…という印象ですので、もしAviutlのフィルタを使用しているのでしたら、一時的に切ってみて速度を確認してみてください。

Re: Re: No title

フィルタを切ってみたのですが、あまりスコアが上がりません。
他プラグインとの競合かなと思い、空にしたAviutlにNvEncと拡張編集などだけを入れたAviutlで試しましたが、あまり変わりませんでした。
以下は他のプラグインも入っている元のAviutlでエンコードした際のログになります。

------------------------------------------------------------------------------------------------------------------------------
[C:\Users\Harumi Shibukawa\Desktop\videos\Enocord_test\His Of GDO-gpu2.mp4]
------------------------------------------------------------------------------------------------------------------------------
auo [info]: converting YUY2 -> nv12p, using AVX AVX2
auo [info]: NVEncC options...
-d 0 -c h264 --cqp 20:23:25 --qp-init 20:23:25 --lookahead 32 --gop-len auto -b 0 --log-level debug --perf-monitor all -o
"C:\Users\Harumi Shibukawa\Desktop\videos\Enocord_test\His Of GDO-gpu2.264" --y4m -i -
auo [info]: qaac (v2.68) で音声エンコードを行います。 ABR (AAC) ビットレート指定, 256kbps
Loaded nvEncodeAPI64.dll.
GPUAutoSelect: Success.
raw/y4m reader selected.
InitInput: input selected : 2.
y4m: output to stdout.
y4m: 1920x1080, pitch:1920, bufferSize:3110400.
y4m: y4m(nv12)->nv12 [AVX2], 1920x1080, 60/1 fps
InitInput: Success.
InitCuda: device #0.

Checking Environment Info...
NVEncC (x64) 4.25 (r962) by rigaya, Nov 19 2018 23:02:37 (VC 1900/Win/avx2)
OS Version Windows 10 x64 (17763)
CPU Intel Core i5-8400 @ 2.80GHz [TB: 3.78GHz] (6C/6T)
GPU #0: GeForce GTX 1060 6GB (416.94)
NVENC / CUDA NVENC API 8.1, CUDA 10.0, schedule mode: unknown
cuInit: Success.
cuDeviceGetCount: Success.
cuDeviceGet: ID:0.
cuDeviceComputeCapability: Success: 6.1.
NVENC capabilities: OK.
using cuda schedule mode: auto.
cuCtxCreate: Success.
cuCtxPopCurrent: Success.
cuvidInit: Success.
cuvidCtxLockCreate: Success.
InitCuda: Success.
nvEncodeAPICreateInstance(APIVer=0x71020008): Success.
NvEncOpenEncodeSessionEx(device_type=NV_ENC_DEVICE_TYPE_CUDA): Success.
InitNVEncInstance: Success.
Eanble NVML Monitoring
Performace Monitor: cpu,cpu_aud,mem,io,fps,fps_avg,bitrate,bitrate_avg,frame_out,gpu_load,gpu_clock,vee_load,pcie_load,ve_clock,queue
Performace Plot : none
createDeviceFeatureList: Success.
InitDecoder: Success.
InitFilters: Success.
SetInputParam: Success.
m_pEncodeAPI->nvEncInitializeEncoder: Success.
CreateEncoder: Success.
AllocateIOBuffers: Success.
InitChapters: Success.
bitstream: Opened file "C:\Users\Harumi Shibukawa\Desktop\videos\Enocord_test\His Of GDO-gpu2.264"
bitstream: Added 8 MB output buffer.
Output: Initialized bitstream writer.
InitOutput: Success.
NVEncC (x64) 4.25 (r962) by rigaya, Nov 19 2018 23:02:37 (VC 1900/Win/avx2)
OS Version Windows 10 x64 (17763)
CPU Intel Core i5-8400 @ 2.80GHz [TB: 3.78GHz] (6C/6T)
GPU #0: GeForce GTX 1060 6GB (1280 cores, 1784 MHz)[PCIe3x16][416.94]
NVENC / CUDA NVENC API 8.1, CUDA 10.0, schedule mode: auto
Input Buffers CUDA, 41 frames
Input Info y4m(nv12)->nv12 [AVX2], 1920x1080, 60/1 fps
Vpp Filters copyHtoD
Output Info H.264/AVC high @ Level auto
1920x1080p 1:1 60.000fps (60/1fps)
Encoder Preset default
Rate Control CQP I:20 P:23 B:25
Lookahead on, 32 frames, Adaptive I, B Insert
GOP length 600 frames
B frames 0 frames
Ref frames 3 frames, LTR: off
AQ off
Others mv:auto cabac deblock adapt-transform:auto
auo [info]: 音声処理の終了を待機しています...
y4m: header1: finish.

Flushed Encoder
bitstream: Closing...
bitstream: Closed file pointer.
bitstream: Closed.
y4m: Closing...
y4m: Close...

encoded 21873 frames, 23.46 fps, 2184.67 kbps, 94.94 MB
encode time 0:15:32, CPU: 1.4, GPU: 2.0, VE: 4.5, GPUClock: 1569MHz, VEClock: 1279MHz
frame type IDR 38
frame type I 38, total size 4.21 MB
frame type P 21835, total size 90.73 MB
nvEncDestroyEncoder: success.
Closing perf monitor...
auo [info]: CPU使用率: Aviutl: 55.48% / NVEnc: 1.49%
auo [info]: NVEncエンコード時間 : 0時間15分33.6秒
auo [info]: 音声処理の終了を待機しています...
auo [info]: L-SMASH muxer (r1474)でmuxを行います。映像: on, 音声: on, tc:off, chap:off, 拡張モード:なし
auo [info]: 総エンコード時間 : 0時間15分39.2秒

Re: Re: Re: No title

ログの情報、ありがとうございます。たしかにちょっと遅い感じがしますね…。

いただいた情報で気になる点として、AviutlのCPU使用率が高い点が挙げられます。
auo [info]: CPU使用率: Aviutl: 55.48% / NVEnc: 1.49%

やはり、Aviutlのほうでなにかボトルネックがある可能性があります。

フィルタでないとすると、読み込みプラグインが原因の可能性もあります。例えば、L-SMASH Worksのlwinput.auiですと、
・threadをデフォルトの"0"に戻してみる
・Video Scalerを「Fast Bilinear」にしてみる
・Preferred Deocdersは空白に戻してみる
などが挙げられます。

ご参考までに、こちらでのGTX1060でのfullHDのエンコードログを載せてみました。入力はH.264 1920x1080 23.976fps 25.6Mbpsで、これをL-SMASH Worksのlwinput.auiで読み込んでいます。

auo [info]: converting YUY2 -> nv12p, using AVX AVX2
auo [info]: NVEncC options...
-d 1 -c h264 --cqp 20:23:25 --qp-init 20:23:25 --lookahead 32 --gop-len auto -b 0 --perf-monitor all -o
"F:\temp\点test-002.264" --y4m -i -
auo [info]: qaac (v2.67) で音声エンコードを行います。 ABR (AAC) ビットレート指定, 256kbps
NVEncC (x64) 4.19 (r881) by rigaya, Oct 8 2018 18:34:56 (VC 1900/Win/avx2)
OS Version Windows 10 x64 (17134)
CPU Intel Core i9-7980XE @ 2.60GHz [TB: 4.11GHz] (18C/36T)
GPU #1: GeForce GTX 1060 6GB (1280 cores, 1708 MHz)[416.81]
NVENC / CUDA NVENC API 8.1, CUDA 10.0, schedule mode: auto
Input Buffers CUDA, 41 frames
Input Info y4m(nv12)->nv12 [AVX2], 1920x1080, 24000/1001 fps
Vpp Filters copyHtoD
Output Info H.264/AVC high @ Level auto
1920x1080p 1:1 23.976fps (24000/1001fps)
Encoder Preset default
Rate Control CQP I:20 P:23 B:25
Lookahead on, 32 frames, Adaptive I, B Insert
GOP length 240 frames
B frames 0 frames
Ref frames 3 frames, LTR: off
AQ off
Others mv:auto cabac deblock adapt-transform:auto
auo [info]: 音声処理の終了を待機しています...


encoded 2293 frames, 269.80 fps, 8510.76 kbps, 97.03 MB
encode time 0:00:08, CPU: 0.8, GPU: 8.2, VE: 55.1, GPUClock: 1862MHz, VEClock: 1664MHz
frame type IDR 11
frame type I 11, total size 2.00 MB
frame type P 2282, total size 95.03 MB
auo [info]: CPU使用率: Aviutl: 12.30% / NVEnc: 3.00%
auo [info]: NVEncエンコード時間 : 0時間 0分12.7秒
auo [info]: 音声処理の終了を待機しています...
auo [info]: L-SMASH muxer (r1474)でmuxを行います。映像: on, 音声: on, tc:off, chap:off, 拡張モード:なし
auo [info]: 総エンコード時間 : 0時間 0分15.0秒


VE使用率 55%で、270fpsぐらい出ています。なお、Aviutl経由では、VEの使用率は50%前後行けばよいほうだと思います。

No title

わざわざエンコードログまで、ありがとうございます。
自分の環境では、読み込みプラグインの設定は特に変更していなかったので、また同じような結果となりました。
自分は入力プラグインとしてL-SMASH WORKSとDirectSHow Readerしか入れておらず、優先順位の設定、読み込みプラグインの設定も特に問題ありませんでした。
読み込みプラグインをL-SMASH WORKSのみして、x264の動画しか入っていない状態でも同じような結果だったので、L-SMASH WORKSがx264の読み込みに手間取ってるという状況なのでしょうか?
それともi5-8400では力不足なのでしょうか?

Re: No title

うーん、入力プラグインでもなかったですか…。

いまのところ、ちょっと原因が思いつかないです。Benchmark pluginで、Aviutlだけの速度(エンコードなしで、デコード・フィルタのみの速度)を測ってみていただけると、エンコード側の問題かその前までの段階の問題かわかるかと思います。
http://csbarn.blogspot.com/2012/05/benchmark-plugin.html

i5-8400は6コアのCPUかと思いますので、fullHDのH.264デコードに手間取るというのは、なかなか考えづらいのですが…。
プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先(@を半角にしてください!)
rigaya34589@live.jp
github

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutlプラグイン
x264guiEx 2.xx (ミラー)
- x264を使用したH264出力
- x264guiExの導入>
- x264.exeはこちら>

x265guiEx (ミラー)
- x265を使用したH.265/HEVC出力
- x265.exeはこちら>

QSVEnc + QSVEncC (ミラー)
- QuickSyncVideoによるH264出力
- QSVEncCはコマンドライン版
- QSVEncC 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC (ミラー)
- NVIDIAのNVEncによるH264出力
- NVEncCオプション一覧>

VCEEnc + VCEEncC (ミラー)
- AMDのVCEによるH.264出力
- VCEEncCオプション一覧>

svtAV1guiEx (ミラー)
- SVT-AV1によるAV1出力

ffmpegOut (ミラー)
- ffmpeg/avconvを使用した出力

自動フィールドシフト (ミラー)
- SSE2~AVX2による高速化版
- オリジナル: aji様

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX2による高速化版
- オリジナル: まじぽか太郎様

PMD_MT (ミラー)
- SSE2~FMA3による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (ミラー使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR