ZHCACB1 February   2023 AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1

 

  1.   摘要
  2.   商标
  3. 1引言
    1. 1.1 更改 Cortex-A53 时钟频率
  4. 2处理器内核基准测试
    1. 2.1 Dhrystone
  5. 3计算和存储系统基准测试
    1. 3.1 存储器带宽和延迟
      1. 3.1.1 LMBench
      2. 3.1.2 STREAM
      3. 3.1.3 临界存储器访问延迟
    2. 3.2 CoreMark-Pro
    3. 3.3 快速傅里叶变换
    4. 3.4 加密基准测试
  6. 4应用基准测试
    1. 4.1 机器学习推理
  7. 5参考文献

快速傅里叶变换

快速傅里叶变换 (FFT) 是常见的信号处理算法之一。本节介绍了 Arm-Cortex-A53 和 C7x 处理器的 FFT 性能结果。表 3-6 展示了在 Arm-Cortex-A53 和 C7x DSP 上的 1024 点单精度浮点复杂 FFT 执行时间。Arm-Cortex-A53 基准测试使用了 Ne10 库,该库利用了 Cortex-A53 的高级 SIMD 或 NEON 加速。此库不包含在 SDK 中,但可以从官方 Ne10 代码库下载。在 C7x 上,SDK 中可用的 FFT 库用于对性能进行基准测试。在具有热 L2 缓存的裸机上执行的代码。

表 3-6 NE10 CFFT 基准测试
1.25GHz 下的
Arm-Cortex-A53(单线程/内核)
1.4GHz 下的 Arm-Cortex-A53(单线程/内核)1.0GHz 下的 C7x
1024 点复杂 FFT 执行时间21.7 µs19.4 µs1.8µs