ZHCAF33 March   2025 AM62L

 

  1.   1
  2.   摘要
  3.   商标
  4. 1引言
  5. 2处理器内核和计算基准测试
    1. 2.1 Dhrystone
    2. 2.2 Whetstone
    3. 2.3 Linpack
    4. 2.4 NBench
    5. 2.5 CoreMark-Pro
    6. 2.6 快速傅里叶变换
    7. 2.7 加密基准测试
  6. 3存储器系统基准测试
    1. 3.1 存储器带宽和延迟
      1. 3.1.1 LMBench
      2. 3.1.2 STREAM
    2. 3.2 临界存储器访问延迟
    3. 3.3 UDMA:DDR 至 DDR 数据复制
  7. 4总结
  8. 5参考资料

CoreMark-Pro

CoreMark®-Pro 测试了整个处理器,增加了对多核技术,整数和浮点工作负载以及用于利用更大存储子系统的数据集的全面支持。CoreMark-Pro 的组件利用各种级别的高速缓存,数据存储器容量高达 3MB。许多但并非所有测试会使用 P 线程,以便允许执行多个内核。分数随内核数量的增加而增加,但总是低于线性增加(双核分数小于单核分数的 2 倍)。

不得将 CoreMark-Pro 与更小巧的 CoreMark 混淆,后者和 Dhrystone 一样,都是包含在现代处理器 L1 高速缓存中的微基准。

CoreMark-Pro 不包含在 SDK 中,可以从 CoreMark-Pro 下载。在此测试中,直接克隆代码并将其内置在 AM62Lx EVM 中。下面的步骤用于直接在目标上克隆、构建和运行 CoreMark-Pro:

  1. 克隆存储库。
    root@am62lxx-evm:~# git clone https://github.com/eembc/coremark-pro.git
  2. 构建 CoreMark-Pro。
    root@am62lxx-evm:~# cd coremark-pro/
    root@am62lxx-evm:~/coremark-pro# make TARGET=linux64 build-all
  3. 运行 CoreMark-Pro:使用“certify-all”运行 CoreMark-Pro 的所有 9 个基准测试并使用“XCMD”设置内核数量。
    root@am62lxx-evm:~/coremark-pro# make TARGET=linux64 certify-all XCMD='-c2'

基准测试输出:

root@am62lxx-evm:~/coremark-pro# make TARGET=linux64 certify-all XCMD='-c2'
.
.
WORKLOAD RESULTS TABLE

                                                 MultiCore SingleCore           
Workload Name                                     (iter/s)   (iter/s)    Scaling
----------------------------------------------- ---------- ---------- ----------
cjpeg-rose7-preset                                   71.43      37.04       1.93
core                                                  0.52       0.27       1.93
linear_alg-mid-100x100-sp                            24.58      12.92       1.90
loops-all-mid-10k-sp                                  0.72       0.43       1.67
nnet_test                                             1.96       1.01       1.94
parser-125k                                           6.85       7.09       0.97
radix2-big-64k                                       32.47      22.28       1.46
sha-test                                            138.89      73.53       1.89
zip-test                                             33.90      20.00       1.69

MARK RESULTS TABLE

Mark Name                                        MultiCore SingleCore    Scaling
----------------------------------------------- ---------- ---------- ----------
CoreMark-PRO                                       1189.42     710.32       1.67

所有正式的 CoreMark-Pro 规则都已得到满足,例如确保每个工作负载的执行时间至少是最小计时器分辨率的 1000 倍。表 2-5 展示了单核和双核 A53 在 1.25GHz 下的 CoreMark-Pro 结果。

表 2-5 CoreMark-Pro 结果
Arm-Cortex-A53
(1.25GHz) [iter/s]
并行缩放
单核7101
双核1,1891.67