M.2-PCIe変換ケーブルで10GbEカードを無理やり使いたい
RTX4080はでかく、3スロット占有してしまう。
そのため、Aldelake PCのPCIeスロットはこんな感じになってしまった。
1. 空き
2. RTX4080 PCIe4x16
3. RTX4080
4. RTX4080 PCIe3x1
5. Arc A380 PCIe3x4 (x16形状)
6. Arc A380
7. GTX1060 PCIe3x1 (x16形状)
8. GTX1060
ちなみにCPUはi9 12900K、マザーはMSI MAG Z690 TOMAHAWK WIFI DDR4。

以前のRTX2070は2スロットだったため、Arc A380との間の「4」の位置に空きがあり、ここに10GbEのLANカードを取り付けていたが、これが不可能になってしまった。
そこで、唯一開いている「1」の位置に無理やり10GbE LANカードを取り付けることにした。
そのため、Aldelake PCのPCIeスロットはこんな感じになってしまった。
1. 空き
2. RTX4080 PCIe4x16
3. RTX4080
4. RTX4080 PCIe3x1
5. Arc A380 PCIe3x4 (x16形状)
6. Arc A380
7. GTX1060 PCIe3x1 (x16形状)
8. GTX1060
ちなみにCPUはi9 12900K、マザーはMSI MAG Z690 TOMAHAWK WIFI DDR4。
以前のRTX2070は2スロットだったため、Arc A380との間の「4」の位置に空きがあり、ここに10GbEのLANカードを取り付けていたが、これが不可能になってしまった。
そこで、唯一開いている「1」の位置に無理やり10GbE LANカードを取り付けることにした。
AVX512のエンコード高速化効果
Ryzen 9 7950Xでは、AMD CPUとして初めてAVX512が実装された。
とはいえ、現状では256bitx2としての実装にとどまっていて、スループット自体はAVX2(256bit)と同じになっている。
そのため、AVX512を使用することによる恩恵は限定的。ぱっと考えられる恩恵はだいたい以下のおとり。
(1). AVX512の新要素での高速化
新命令、マスクレジスタ、組み込みbroadcast、レジスタ倍増(16→32)
(2). 演算ユニットを埋めやすくなり、レイテンシの隠蔽も容易に
(3). (相対的に)フロントエンドへの負担が減ることによる効率化
ということで、実際のところどうなのかを確認してみた。
とはいえ、現状では256bitx2としての実装にとどまっていて、スループット自体はAVX2(256bit)と同じになっている。
そのため、AVX512を使用することによる恩恵は限定的。ぱっと考えられる恩恵はだいたい以下のおとり。
(1). AVX512の新要素での高速化
新命令、マスクレジスタ、組み込みbroadcast、レジスタ倍増(16→32)
(2). 演算ユニットを埋めやすくなり、レイテンシの隠蔽も容易に
(3). (相対的に)フロントエンドへの負担が減ることによる効率化
ということで、実際のところどうなのかを確認してみた。
RTX4080の12VHPWRの温度を見てみよう
この前RTX4080をゲットして、また散財してしまったわけだが、RTX40xxシリーズに使用される12VHPWR電源コネクタはまれに溶けるので話題になった。

NVIDIA公式では、原因は挿し込み不良ということで、きちんと差し込めばよいとのこと。
ただ、RTX4090では50件ほど問題が起こった事例があったよう。実験目的を除き、わざと十分に挿し込まないということは考えにくいので、もしかすると挿し込んだつもりでも、十分挿し込めてないのかも、となると、じゃあ自分がちゃんと挿し込めているのかというとでちょっと不安になる。
RTX4080を買ったときは、公式発表もまだでちょっと不安だったので、実際にコネクタ周りの温度を確認してみることにした。

NVIDIA公式では、原因は挿し込み不良ということで、きちんと差し込めばよいとのこと。
ただ、RTX4090では50件ほど問題が起こった事例があったよう。実験目的を除き、わざと十分に挿し込まないということは考えにくいので、もしかすると挿し込んだつもりでも、十分挿し込めてないのかも、となると、じゃあ自分がちゃんと挿し込めているのかというとでちょっと不安になる。
RTX4080を買ったときは、公式発表もまだでちょっと不安だったので、実際にコネクタ周りの温度を確認してみることにした。
また散財してしまった → RTX4080
Ryzen 9 7950Xでの温度上限調整
Ryzen 9 7950Xの内蔵GPUでVCE/VCN hwエンコード
Ryzen 9 7950X + RX5500XTの環境で、VCEEncで内蔵GPUを使ってエンコードできることを確認。
方法は、--check-hwでGPUデバイス番号を調べて、"-d x"でデバイス番号を指定して実行するだけ。
ただ、Aviutlのプラグインのほうには現時点でGPUを選択する設定欄がないので、「その他」タブの「追加コマンド」に"-d 0"とか"-d 1"を入れてあげてください。
そのうちNVEncやQSVEncみたいに設定欄を追加したいです。
方法は、--check-hwでGPUデバイス番号を調べて、"-d x"でデバイス番号を指定して実行するだけ。
Ryzen 9 7950X + RX5500XTの環境で、VCEEncで内蔵GPUを指定してVCE/VCN hwエンコードできることを確認できた!
— rigaya (@rigaya34589) October 17, 2022
--check-hwでデバイス番号を調べてから、"#1"が内蔵GPUとわかるので"-d 1"を追加して実行。
VCEEncでのデバイス番号は、タスクマネージャの"GPU0"/"GPU1"とはあってないので注意。 pic.twitter.com/eCvaEXqhxm
ただ、Aviutlのプラグインのほうには現時点でGPUを選択する設定欄がないので、「その他」タブの「追加コマンド」に"-d 0"とか"-d 1"を入れてあげてください。
そのうちNVEncやQSVEncみたいに設定欄を追加したいです。
これまでのメモリ・キャッシュ速度のまとめ
この前、いつも自作アプリで計測しているメモリ・キャッシュ速度をR9 7950Xで測定してみて、L2倍増の効果や、DDR5採用の効果を確認することができた。
このときは見やすさを優先して、最近のCPUの結果だけをまとめたのだけど、これまで測定した結果をまとめたグラフを作ってみた。 → 実際のグラフのページはこちら。
以下はそのスクリーンショット。

CPUのメモリやキャッシュの帯域が少しずつ高速化しているのが確認できる。
ごちゃごちゃしているけど、リンク先のほうはchart.jsベースにしたので、グラフをオン・オフしたり、マウスをあてると実際の値を確認できるので便利。
このときは見やすさを優先して、最近のCPUの結果だけをまとめたのだけど、これまで測定した結果をまとめたグラフを作ってみた。 → 実際のグラフのページはこちら。
以下はそのスクリーンショット。

CPUのメモリやキャッシュの帯域が少しずつ高速化しているのが確認できる。
ごちゃごちゃしているけど、リンク先のほうはchart.jsベースにしたので、グラフをオン・オフしたり、マウスをあてると実際の値を確認できるので便利。