ZHCAF33 March   2025 AM62L

 

  1.   1
  2.   摘要
  3.   商标
  4. 1引言
  5. 2处理器内核和计算基准测试
    1. 2.1 Dhrystone
    2. 2.2 Whetstone
    3. 2.3 Linpack
    4. 2.4 NBench
    5. 2.5 CoreMark-Pro
    6. 2.6 快速傅里叶变换
    7. 2.7 加密基准测试
  6. 3存储器系统基准测试
    1. 3.1 存储器带宽和延迟
      1. 3.1.1 LMBench
      2. 3.1.2 STREAM
    2. 3.2 临界存储器访问延迟
    3. 3.3 UDMA:DDR 至 DDR 数据复制
  7. 4总结
  8. 5参考资料

Dhrystone

Dhrystone 基准测试侧重于处理器内核性能。该基准测试在所有现代处理器中均采用预加载 L1 高速缓存运行。该基准测试随时钟速度的增加而线性增加。虽然该基准测试于 1984 年由 Reinhold P. Weicker 引入,但 Dhrystone 至今仍用于嵌入式处理。业界已采用 VAX 11/780 作为参考 1 MIPS 机器。VAX 11/780 每秒可达到 1757 Dhrystones。计算分数时,通过参考 1MIPS 机器的分数 (1757),对基准测试循环运行的时间进行归一化。由于分数随时钟速度的增加而线性增加,常见问题被进一步归一化为 DMIPS/MHz/内核。对于标准 Arm 内核,在相同的编译器和标志中,DMIPS/MHz 将是相同的。Dhrystone 是一个单核基准测试,有时会使用多个简单内核并行运行此基准测试。

Dhrystone(版本 2.1,C 语言)基准测试包含在 SDK 中,只需运行命令 dhrystone 即可执行。由于执行时间短,TI 建议运行大量迭代测试以测量准确的结果。在为 Arm-Cortex-A53 实施的测试中使用了 10 亿次迭代。下面的代码块展示了用于 Dhrystone 基准执行的终端打印输出的简短版本。

root@am62lxx-evm:~# dhrystone 

Dhrystone Benchmark, Version 2.1 (Language: C)

Program compiled without 'register' attribute

Please give the number of runs through the benchmark: 1000000000

Execution starts, 1000000000 runs through Dhrystone
Execution ends

Final values of the variables used in the benchmark:
.
.
.
Microseconds for one run through Dhrystone:    0.2 
Dhrystones per Second:                      6410256.5 

表 2-4 展示了此基准测试的结果,其中包含编译器和操作系统详细信息。具有两个 A53 内核的 AM62Lx 在 1.25GHz 下运行的汇总分数为 7,296 DMIPS。

表 2-1 Dhrystone 基准测试
Arm-Cortex-A53 (1.25GHz)
Dhrystones/s

6,410,256

归一化 dhrystones(除以参考 1MIPS 机器的 1757)

3648

每个核心的 DMIPS/MHz

≃3

编译器和标志GCC 13.3.0 -march=ARMv8 -O3
操作系统Linux 6.12.0