ZHCAF33 March   2025 AM62L

 

  1.   1
  2.   摘要
  3.   商标
  4. 1引言
  5. 2处理器内核和计算基准测试
    1. 2.1 Dhrystone
    2. 2.2 Whetstone
    3. 2.3 Linpack
    4. 2.4 NBench
    5. 2.5 CoreMark-Pro
    6. 2.6 快速傅里叶变换
    7. 2.7 加密基准测试
  6. 3存储器系统基准测试
    1. 3.1 存储器带宽和延迟
      1. 3.1.1 LMBench
      2. 3.1.2 STREAM
    2. 3.2 临界存储器访问延迟
    3. 3.3 UDMA:DDR 至 DDR 数据复制
  7. 4总结
  8. 5参考资料

临界存储器访问延迟

本节提供从 AM62Lx 中的处理器到系统中的各种存储器目标的往返读取延迟测量。测量是使用裸机芯片验证测试在 AM62Lx 平台上进行的。测试在使用 LPDDR4 的 A53 处理器上执行。每个测试包括一个由 8192 次迭代组成的循环,可读取总计 32KiB 的数据。每次访问的周期数被计数并除以相应的处理器时钟频率以获得延迟时间。

出于进行此延迟测量的目的,请禁用所有自动时钟门控。默认情况下,自动时钟门控(不启用时钟门控)已启用,以节省互连系统的功耗,但会对延迟性能造成轻微影响(约十几纳秒)。自动时钟门控以分布式方式完成,每个 IP 都有一个或多个不启用时钟门控的控制。这些参数通常由器件管理在初始化时以及进入和退出低功耗模式时进行配置。表 3-4 展示了平均延迟结果。

测试在以下条件下完成:1.25Ghz A53 内核和 1600MT/s LPDDR4。ARM 架构提供本地内部低延迟路径,还允许通过 SoC 总线基础设施对外部存储器进行访问。

表 3-4 A53 的关键存储器访问延迟
存储器

Arm-Cortex-A53 (平均 ns)

SoC 地址

LPDDR4

155

0x80000000
OCSRAM MAIN

42

0x70800000
OCSRAM WKUP

108

0x707f0000