Radxa ROCK 5Bでベンチマーク

前回はRadxa ROCK 5Bのセットアップ方法を紹介したので、今回はそのベンチマークをして、性能をチェックしてみた。

ROCK 5BのCPUのRK3588は、Cortex-A76を4コアとCortex-A55を4コア搭載しているので、SBCとしては比較的高性能かも?



Rockchip RK3588



RK3588は、8nmプロセスで製造され、CPUについてはCortex-A76 2.4GHzを4コアとCortex-A55 1.8GHzを4コアの計8コアとなっている。

Cortex-A76は、2018年に発表されたARMの"big"コアで、4way decodeのOoO実行。モバイル向けとはいえかなり強力なコアになっている。

Cortex-A55のほうは、ARMの"little"コアなので、こちらは2way decodeのIn Order実行。クロックも低いので、まああまり性能は期待しないほうがよさそう。

GPUは、Mali G610 MP4というGPUで、4シェーダコア、L2 Cache 1MBで実装されている。シェーダコアあたり16レーンの実行ユニットを2基搭載したクラスタを2つ持っているため、GPU全体の演算基は256基となり、これもそこそこの規模となっている。(例えばAlderlakeのGT1も32EUなので、256基)



比較環境



Jetson Nanoと、ちょっと前の4コア程度のIntel/AMD CPUと比較した。

RK3588Jetson
Nano
R3 3200Gi5 7500i5 1035G7
スレッド数8C/8T4C/4T4C/4T4C/4T4C/8T
コア/クロックA76 2.4GHz
A55 1.8GHz
A57
2.0GHz
Zen+
3.6GHz
KBL
3.8GHz
ICL
3.7GHz
RAMLPDDR4X
-4224
LPDDR4
-3200
DDR4
-2400
DDR4
-2666
LPDR4X
-3733
RAM容量8GB2GB8GB8GB8GB
GPU EU4SC1SM8CU24EU64EU
GPU演算器256128512192512
OSUbuntu
20.04
Ubuntu
20.04
Win 11Win 10Win 11

Intel/AMDのCPUはデスクトップ用で、クロックがRock 5Bの1.5倍程度あるので、どうしてもRock 5Bは不利になるけど、まあ比較対象としては同じ4コアだしありかなと。

なお、さすがにOSは揃えられてはいないので注意。



CPU: x264



まずffmpegのx264で1080pの映像のエンコード速度から。crf=20でその他オプションは指定していない。

ffmpeg -y -i input.mp4 -c:v libx264 -crf 20 -an output.mp4

エンコード速度(fps)をまとめると下記の通り。


Jetson Nanoと比べると圧倒的に高速。

デスクトップ系の石との比較では、やはりクロックの差は大きく、絶対性能は控えめ。あまりこの性能でエンコードをしたくはないだろう。

一方、クロックの分を差し引くとちょっと遅いだけとなり、そこそこよい勝負になっている。i5 7500やR3 3200Gはわりと前のCPUであるとはいえ、デスクトップのCPUと比較可能なレンジの性能が出ているのは結構驚きだ。ファンレスで問題ないほど低電力でこのぐらい出るのは、わりとすごいかもしれない。



CPU: 7-zip





こちらも同様の傾向。やはりJetson Nanoと比べると圧倒的に高速。

ただ、Rock 5BはRyzen 3200Gやi5 7500に対しては、クロックの分を差し引くとちょっと遅いだけだが、Icelake(i5 1035G7)に対してはかなり大きな差となっていることがわかる。



GPU: mixbench



CPUはここまでで、今度はGPU。

GPUのピーク性能をOpenCLで引き出して計測するベンチマーク。演算とメモリアクセスの比率(グラフ横軸)を変え、ピーク演算性能とピークメモリバンド幅を取得することができる。



まずはGPU演算性能から。


このグラフから、それぞれのピーク性能を取るとこんな感じ。


Rock 5B RK3588は、Jetson Nanoの2倍程度、i5 7500の内蔵GPUよりやや高速ということで、そこそこのパワーのあるGPUを積んでいることがわかる。

とはいえ、演算器の数の多いR3 3200Gや、i5 1035G7と比べると、大きな差がある。



次にメモリバンド幅。GPU側から引き出せるメモリ帯域を確認できる。


このグラフから、それぞれのピーク性能を取るとこんな感じ。


Rock 5B RK3588は、Jetson Nanoよりやや高速、i5 7500の内蔵GPUよりわずかに遅いぐらい。RK3588の理論帯域は33.8GB/sなので、まあこんなもんだろうか。とはいえ、SBCとしては立派な数字だと思う。

3200Gやi5 1035G7はさすがにかなりのメモリ帯域が引き出せる。ただ、演算器の性能に見合っているかというと微妙で、やはり内蔵GPUはメモリ帯域のほうが苦しくなりがちというのを示していると思う。この辺りはDDR5世代になると少しはましになるだろうか?



M.2 SSD: EXCERIA NVMe PLUS SSD 1TB



SSDの性能は、KDiskMarkというLinuxで動作するベンチマークソフトで測定した。

どっかで見たことあるようなUIである。

rock5b_kioxia_exceria_plus_1TB.png

このSSDは、Seq Readで最大3400MB/s程度まで出るはずだが、2624MB/sにとどまっていて、さすがにフルスピードは出せなかったようだ。とはいえ、これだけ出れば十分だし、実際ディスク操作は非常に快適だ。

SBCでNVMe SSDを使えるのは大きなメリットだと思う。

ただ、今回使用したSSDはオーバースペック感があるので、8ch動作のSSDでなくとも、4ch動作のものでも十分だとは思う。そのほうが値段も抑えられて片面実装のものも選びやすいかもしれない。



LAN: RTL8125 2.5GbE Controller



iprefで測定した。

最大で2.35Gbps出ていて、非常に優秀。

rigaya@rock-5b:~$ iperf3 -c 192.168.0.24 -p 5201 -t 10 -i 1 -V
iperf 3.7
Linux rock-5b 5.10.110-37-rockchip-g74457be0716d #rockchip SMP Mon Feb 6 09:18:21 UTC 2023 aarch64
Control connection MSS 1460
Time: Sun, 26 Mar 2023 00:55:42 GMT
Connecting to host 192.168.0.24, port 5201
      Cookie: 26xc2povt2aa5lhfin4du2x4lkqmqbjqlkfx
      TCP MSS: 1460 (default)
[  5] local 192.168.0.31 port 56038 connected to 192.168.0.24 port 5201
Starting Test: protocol: TCP, 1 streams, 131072 byte blocks, omitting 0 seconds, 10 second test, tos 0
[ ID] Interval           Transfer     Bitrate         Retr  Cwnd
[  5]   0.00-1.00   sec   280 MBytes  2.35 Gbits/sec    0    315 KBytes
[  5]   1.00-2.00   sec   269 MBytes  2.25 Gbits/sec    0    315 KBytes
[  5]   2.00-3.00   sec   276 MBytes  2.32 Gbits/sec    0    315 KBytes
[  5]   3.00-4.00   sec   269 MBytes  2.26 Gbits/sec    0    315 KBytes
[  5]   4.00-5.00   sec   271 MBytes  2.28 Gbits/sec    0    315 KBytes
[  5]   5.00-6.00   sec   275 MBytes  2.31 Gbits/sec    0    315 KBytes
[  5]   6.00-7.00   sec   271 MBytes  2.28 Gbits/sec    0    315 KBytes
[  5]   7.00-8.00   sec   272 MBytes  2.29 Gbits/sec    0    315 KBytes
[  5]   8.00-9.00   sec   266 MBytes  2.23 Gbits/sec    0    315 KBytes
[  5]   9.00-10.00  sec   269 MBytes  2.25 Gbits/sec    0    315 KBytes
- - - - - - - - - - - - - - - - - - - - - - - - -
Test Complete. Summary Results:
[ ID] Interval           Transfer     Bitrate         Retr
[  5]   0.00-10.00  sec  2.66 GBytes  2.28 Gbits/sec    0             sender
[  5]   0.00-10.00  sec  2.65 GBytes  2.28 Gbits/sec                  receiver
CPU Utilization: local/sender 17.1% (0.3%u/16.7%s), remote/receiver 36.1% (15.6%u/20.5%s)
snd_tcp_congestion cubic

iperf Done.



まとめ



全体的にSBCとしては非常に性能が高く、快適に使える環境で、これが非常に小さなサイズに収まっているのでかなり面白い。

ただ、その分、そこそこの値段がしてしまうのも事実で、本体24000円、これに追加でケース、ヒートシンク、電源、SSDは別途必要。

最近はAlderlake-NのNUCなんかもあって、Beelink Mini S12を例にとれば、

・Alderlake N95 Eコアx4 (Max 3.4GHz)
・メモリ 8GB DDR4-3200 (1ch)
・iGPU 16EU @ 1.2GHz
・NVMe SSD (PCIe3x1)
・1GbE, Wifi5 (802.11ac)
・Windows 11 Pro付き
・HDMI x2
・USB3.2 Gen2 x4

まあこのぐらいのスペックで3万円弱とかだったりするので、まあだいたい同じくらいの値段になってしまう。

普通にPCとして使うなら、Windowsもついてくるし、ソフトウェア関連で苦労しなくていいAlderlake-N NUCでよくね感は結構感じてしまう。というかこの辺のNUCほんと安すぎ…。

もちろんArm系に興味があったり、低電力・超小型に魅力を感じるなら、今回確認したように結構快適に動作するので、楽しめると思う。
スポンサーサイト



コメントの投稿

非公開コメント

プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先: rigaya34589@live.jp
github twitter

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutl 出力プラグイン
x264guiEx 3.xx
- x264を使用したH264出力
- x264guiExの導入紹介動画>
- x264guiExの導入
- x264guiExのエラーと対処方法>
- x264.exeはこちら>

x265guiEx
- x265を使用したH.265/HEVC出力
- x265guiExの導入>
- x265.exeはこちら>

QSVEnc + QSVEncC
- QuickSyncVideoによるHWエンコード
- QSVEnc 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC
- NVIDIAのNVEncによるHWエンコード
- NVEnc 導入/使用方法>
- NVEncCオプション一覧>

VCEEnc + VCEEncC
- AMDのVCE/VCNによるHWエンコード
- VCEEnc 導入/使用方法>
- VCEEncCオプション一覧>

svtAV1guiEx
- SVT-AV1によるAV1出力
- svtAV1guiExの導入>
- SVT-AV1単体はこちら>

VVenCguiEx
- VVenCによるVVC出力
- VVenCguiExの導入>

ffmpegOut
- ffmpegを使用した出力
- ffmpegOutの導入>


○Aviutl フィルタプラグイン
自動フィールドシフト (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: aji様

clfilters 
- OpenCLベースの複数のGPUフィルタ集
- 対応フィルタの一覧等はこちら

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX512対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: まじぽか太郎様

PMD_MT
- SSE2~AVX512による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
Amatsukaze改造版
- AmatsukazeのAV1対応版

tsreplace
- tsの映像のみを置き換えて圧縮

rkmppenc
- Rockchip系SoCのhwエンコーダ

fawutil
- FAW(FakeAACWave)⇔aac変換
- 二重音声の取り扱いにも対応

x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定
- これまでの測定結果はこちら

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)
SVT-AV1 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR