Video Engine Load 100% の謎
Video Engine 100%といえば、エンコーダを使い切れててうれしい、という話に普通はなるのだが、今回は残念ながらそういう話ではない。
エンコードしなくても、アイドル時にそうなってしまうという、珍妙な現象に遭遇してしまったという話。
実際どんな感じかというと、こんな感じ。ちなみに5分ぐらい放置してもずっとこのままだった。

GPUロード、メモリコントローラロード0、エンコードはしていない、完全にアイドル状態のはずなのだが、なぜかVideo Engine Load 100%で、これのせいでGPUがアイドルに入らず、Boad Powerが33~34Wという状態になってしまっている。
そもそもは、この前、Intel Arc A380をゲットしてベンチマークをいろいろとったあと、最後に効率的にQSV/NVENCの検証環境として使えるように、RTX2070/GTX100/ArcA380を刺した状態にした。

すると、GTX1060のNVENCがうまく動作しなくなり(RTX2070のほうは問題ない)、アイドル電力が異常に高く(134W)なっていることに気づいた。で、GPU-Zで確認するとさっきの状態になってしまっていた。
・OS再起動
・NVIDIA GPUドライバのクリーンインストール
では改善できなかったので、いろいろ確認すると、GTX1060がCPU直結のPCIeレーンにあるときは問題なく、2本あるZ690のPCIeレーンだとどちらでも問題が発生してしまった。
GPU3枚がいかんのかと思ったけど、よく考えたら世の中には平気でGPU8枚とか(もしかしてそれ以上?)ぶら下げている怖い人もいるので、3枚程度では問題にならなそう。
調べてみるとこの症状(Video Engine Load 100)はまれにあるようだが、件数は少ないこともあっていまいち解決法はよくわからず、仕方なくOS再インストールを試したがこれでも改善できなかった。
ここで、BIOSアップデートで改善したという記述を見つけたので、やってみるとやっと問題が解消した。(ここにたどり着くまでかなり時間かかった)
さらに原因を追い込んでいくと、BIOSアップデートそのものが効果があったわけではなく、BIOSアップデートによりBIOSの設定が初期化されたことに意味があったよう。より具体的にはBIOSでASPMを有効にするとこの問題が発生することがわかった。このマザーはPCIeのポートごとにASPMの設定を変更できるため、現状はGTX1060を搭載するPCIeポート(Port2)だけ、ASPMを無効にしている。

これでGTX1060でもNVENCが元通り利用可能になり、アイドル電力も134W→90W程度まで削減できた。
ただ、ベンチマークをする前はASPMを有効にしたZ690のPCIeレーンでGTX1060を使っていてもこんなことにはならなかったので、なにが本当の原因かはよくわからなくてちょっと気持ち悪い。まあとりあえず、問題は解消したのでよかった。
エンコードしなくても、アイドル時にそうなってしまうという、珍妙な現象に遭遇してしまったという話。
実際どんな感じかというと、こんな感じ。ちなみに5分ぐらい放置してもずっとこのままだった。

GPUロード、メモリコントローラロード0、エンコードはしていない、完全にアイドル状態のはずなのだが、なぜかVideo Engine Load 100%で、これのせいでGPUがアイドルに入らず、Boad Powerが33~34Wという状態になってしまっている。
そもそもは、この前、Intel Arc A380をゲットしてベンチマークをいろいろとったあと、最後に効率的にQSV/NVENCの検証環境として使えるように、RTX2070/GTX100/ArcA380を刺した状態にした。

すると、GTX1060のNVENCがうまく動作しなくなり(RTX2070のほうは問題ない)、アイドル電力が異常に高く(134W)なっていることに気づいた。で、GPU-Zで確認するとさっきの状態になってしまっていた。
・OS再起動
・NVIDIA GPUドライバのクリーンインストール
では改善できなかったので、いろいろ確認すると、GTX1060がCPU直結のPCIeレーンにあるときは問題なく、2本あるZ690のPCIeレーンだとどちらでも問題が発生してしまった。
GPU3枚がいかんのかと思ったけど、よく考えたら世の中には平気でGPU8枚とか(もしかしてそれ以上?)ぶら下げている怖い人もいるので、3枚程度では問題にならなそう。
調べてみるとこの症状(Video Engine Load 100)はまれにあるようだが、件数は少ないこともあっていまいち解決法はよくわからず、仕方なくOS再インストールを試したがこれでも改善できなかった。
ここで、BIOSアップデートで改善したという記述を見つけたので、やってみるとやっと問題が解消した。(ここにたどり着くまでかなり時間かかった)
さらに原因を追い込んでいくと、BIOSアップデートそのものが効果があったわけではなく、BIOSアップデートによりBIOSの設定が初期化されたことに意味があったよう。より具体的にはBIOSでASPMを有効にするとこの問題が発生することがわかった。このマザーはPCIeのポートごとにASPMの設定を変更できるため、現状はGTX1060を搭載するPCIeポート(Port2)だけ、ASPMを無効にしている。

これでGTX1060でもNVENCが元通り利用可能になり、アイドル電力も134W→90W程度まで削減できた。
ただ、ベンチマークをする前はASPMを有効にしたZ690のPCIeレーンでGTX1060を使っていてもこんなことにはならなかったので、なにが本当の原因かはよくわからなくてちょっと気持ち悪い。まあとりあえず、問題は解消したのでよかった。

スポンサーサイト