ZHCAF33 March 2025 AM62L
CoreMark®-Pro 测试了整个处理器,增加了对多核技术,整数和浮点工作负载以及用于利用更大存储子系统的数据集的全面支持。CoreMark-Pro 的组件利用各种级别的高速缓存,数据存储器容量高达 3MB。许多但并非所有测试会使用 P 线程,以便允许执行多个内核。分数随内核数量的增加而增加,但总是低于线性增加(双核分数小于单核分数的 2 倍)。
不得将 CoreMark-Pro 与更小巧的 CoreMark 混淆,后者和 Dhrystone 一样,都是包含在现代处理器 L1 高速缓存中的微基准。
CoreMark-Pro 不包含在 SDK 中,可以从 CoreMark-Pro 下载。在此测试中,直接克隆代码并将其内置在 AM62Lx EVM 中。下面的步骤用于直接在目标上克隆、构建和运行 CoreMark-Pro:
root@am62lxx-evm:~# git clone https://github.com/eembc/coremark-pro.gitroot@am62lxx-evm:~# cd coremark-pro/
root@am62lxx-evm:~/coremark-pro# make TARGET=linux64 build-allroot@am62lxx-evm:~/coremark-pro# make TARGET=linux64 certify-all XCMD='-c2'基准测试输出:
root@am62lxx-evm:~/coremark-pro# make TARGET=linux64 certify-all XCMD='-c2'
.
.
WORKLOAD RESULTS TABLE
MultiCore SingleCore
Workload Name (iter/s) (iter/s) Scaling
----------------------------------------------- ---------- ---------- ----------
cjpeg-rose7-preset 71.43 37.04 1.93
core 0.52 0.27 1.93
linear_alg-mid-100x100-sp 24.58 12.92 1.90
loops-all-mid-10k-sp 0.72 0.43 1.67
nnet_test 1.96 1.01 1.94
parser-125k 6.85 7.09 0.97
radix2-big-64k 32.47 22.28 1.46
sha-test 138.89 73.53 1.89
zip-test 33.90 20.00 1.69
MARK RESULTS TABLE
Mark Name MultiCore SingleCore Scaling
----------------------------------------------- ---------- ---------- ----------
CoreMark-PRO 1189.42 710.32 1.67
所有正式的 CoreMark-Pro 规则都已得到满足,例如确保每个工作负载的执行时间至少是最小计时器分辨率的 1000 倍。表 2-5 展示了单核和双核 A53 在 1.25GHz 下的 CoreMark-Pro 结果。
| Arm-Cortex-A53 (1.25GHz) [iter/s] | 并行缩放 | |
|---|---|---|
| 单核 | 710 | 1 |
| 双核 | 1,189 | 1.67 |