Radxa ROCK 5Bのキャッシュ・メモリ帯域

今度はいつもの自作のメモリやキャッシュ速度をはかるプログラムで、Rock 5Bのメモリ・キャッシュの速度を確認してみる。

比較環境



Jetson Nanoと、ちょっと前の4コア程度のIntel/AMD CPUと比較した。

Rock 5BはCortex-A76とCortex-A55という2系統のコアを搭載しているので両方測定した。

RK3588Jetson
Nano
R3 3200Gi5 7500i5 1035G7
スレッド数8C/8T4C/4T4C/4T4C/4T4C/8T
コア/クロックA76 2.4GHz
A55 1.8GHz
A57
2.0GHz
Zen+
3.6GHz
KBL
3.8GHz
ICL
3.7GHz
RAMLPDDR4X
-4224
LPDDR4
-3200
DDR4
-2400
DDR4
-2666
LPDR4X
-3733
RAM容量8GB2GB8GB8GB8GB
GPU EU4SC1SM8CU24EU64EU
GPU演算器256128512192512
OSUbuntu
20.04
Ubuntu
20.04
Win 11Win 10Win 11




まずはメモリアクセスのレイテンシで、キャッシュ階層がわかりやすいようにしたアクセスパターンから。


グラフが表示されない場合はこちら

Rock 5BのCortex-A76はL1=64K、L2=512K、L3=3MB。
Cortex-A55のほうはL1=32KB、L2=128KB、L3=3MB。

L1あたりはわかりやすいものの、L2/L3あたりはあまりきれいに出ておらずわかりにくい。

Jetson Nano(L2=1MB)よりはキャッシュ量が多い。一方で、Intel/AMDのCPUと比べると当然キャッシュ量は少なめとなっていることもわかる。



次に実際のメモリアクセスのレイテンシを測定するランダムなアクセスパターン。


グラフが表示されない場合はこちら

キャッシュの領域では、Rock 5BのA76はJetson Nanoよりは高速でデスクトップ系の石にそこそこ近いレイテンシになっている。

一方、メモリアクセスの領域ではかなりレイテンシが大きい。LPDDR系はレイテンシが大きめというのもあるのかもしれない。

Rock 5BのA55は全領域で遅め。littleコアなので仕方ないと思う。



次に、キャッシュ・メモリの帯域を測定。まずはシングルスレッドから。

グラフが表示されない場合はこちら

クロックが安定しないのか測定結果がガタガタしてしまっているが、なんとなく本来の形はわかりそう。

Rock 5BのA76はまずまずの速度が出ていて、特にL2以降では、i5 1035G7といい勝負になっていると思う。

Rock 5BのA55はやはりかなり遅く、メモリ・キャッシュ性能も限定的ということがわかる。




次にマルチスレッドでアクセスした場合のキャッシュ・メモリの帯域を測定。

グラフが表示されない場合はこちら

Rock 5B A76はそこそこの帯域が出ているとはいってもIntel/AMDのメモリ・キャッシュ性能よりはクロックが低いのもあって当然低め。それでも大きく離されてはいないあたり、消費電力を考えれば優秀かもしれない。

Rock 5B A55の帯域は狭い。これはまあ、こんなものだろう。ただ、全然メモリ帯域を引き出せないJetson Nanoよりはそこそこメモリ帯域を引き出せている。




最後にスレッド数を変えていった時のメモリアクセス速度。

グラフが表示されない場合はこちら

Cortex A76はシングルスレッドで15GB/s、マルチスレッドで21.6GB/sとそこそこのメモリ帯域を引き出せている。Intel/AMDのPCと比べれば低いものの、SBCとしては優秀だと思う。

本題から外れるが、Jetson Nanoは最大でも7.3GB/sとCPU側の帯域は狭い。GPU側からは20GB/sぐらい出るので、やはりGPU全振りのようだ。




ということで、Rock 5Bのメモリアクセス性能を確認した。

絶対性能もまずまずで、SBCで低消費電力なのも考慮すれば優秀な部類なのではないかと思う。このぐらいの性能がファンレスで動いてしまうというのは、なかなか驚きだ。

スポンサーサイト



コメントの投稿

非公開コメント

プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先: rigaya34589@live.jp
github twitter

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutl 出力プラグイン
x264guiEx 3.xx
- x264を使用したH264出力
- x264guiExの導入紹介動画>
- x264guiExの導入
- x264guiExのエラーと対処方法>
- x264.exeはこちら>

x265guiEx
- x265を使用したH.265/HEVC出力
- x265guiExの導入>
- x265.exeはこちら>

QSVEnc + QSVEncC
- QuickSyncVideoによるHWエンコード
- QSVEnc 導入/使用方法>
- QSVEncCオプション一覧>

NVEnc + NVEncC
- NVIDIAのNVEncによるHWエンコード
- NVEnc 導入/使用方法>
- NVEncCオプション一覧>

VCEEnc + VCEEncC
- AMDのVCE/VCNによるHWエンコード
- VCEEnc 導入/使用方法>
- VCEEncCオプション一覧>

svtAV1guiEx
- SVT-AV1によるAV1出力
- svtAV1guiExの導入>
- SVT-AV1単体はこちら>

VVenCguiEx
- VVenCによるVVC出力
- VVenCguiExの導入>

ffmpegOut
- ffmpegを使用した出力
- ffmpegOutの導入>


○Aviutl フィルタプラグイン
自動フィールドシフト (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: aji様

clfilters 
- OpenCLベースの複数のGPUフィルタ集
- 対応フィルタの一覧等はこちら

エッジレベル調整MT (ミラー)
- エッジレベル調整の並列化/高速化
- SSE2~AVX512対応
- オリジナル: まじぽか太郎様

バンディング低減MT (ミラー)
- SSE2~AVX512による高速化版
- オリジナル: まじぽか太郎様

PMD_MT
- SSE2~AVX512による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor (ミラー)
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
Amatsukaze改造版
- AmatsukazeのAV1対応版

tsreplace
- tsの映像のみを置き換えて圧縮

rkmppenc
- Rockchip系SoCのhwエンコーダ

fawutil
- FAW(FakeAACWave)⇔aac変換
- 二重音声の取り扱いにも対応

x264afs (ミラー)
- x264のafs対応版

aui_indexer (ミラー使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter (ミラー)
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (ミラー, 使い方, ソース)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定
- これまでの測定結果はこちら

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)
SVT-AV1 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR