ZHCACP7 may   2023 AM62A3 , AM62A7

 

  1.   1
  2.   摘要
  3.   商标
  4. 1引言
  5. 2AM62A 处理器
  6. 3深度学习基准测试
  7. 4零售结账扫描仪应用
  8. 5核心负载
  9. 6器件选择
  10. 7功耗
  11. 8总结
  12. 9参考文献

AM62A 处理器

AM62A Edge AI 微处理器(如图 2-1 所示)专为对成本和功耗敏感但需要密集图像分析的单摄像头或双摄像头应用而设计。硬件加速可以帮助视觉应用提升图像质量、提高预处理速度并对深度神经网络等分析算法进行加速。

GUID-20230517-SS0I-TCJ6-SGLQ-DH0K3L8D6FTB-low.svg图 2-1 AM62A 简化方框图

图 2-2 演示了视觉分析应用的一般数据流。图像由低成本原始图像传感器(即摄像头)生成。原始图像数据通过 4 通道 MIPI-CSI2 端口进入处理器,该端口可以拆分为多个虚拟通道,以便连接更多摄像头。图像由 ISP 进行增强,以减少噪点、调整白平衡和增益、滤波和内插颜色信息以及处理高动态范围 (HDR) 信息。对于具有广角镜头的应用,镜头失真校正 (LDC) 加速器会减少镜头的扭曲效应。在图像经过预处理以满足 AI 模型的输入规格后,硬件加速器会以 50 至 100 倍的 CPU 性能运行模型;请参阅表 3-1以了解几个模型基准。AI 模型可以完成以下任务:识别食品、在包装上找到条形码、确定客户在何处花费时间最多或检测盗窃模式。

GUID-20230517-SS0I-50GJ-GBZ9-LKDPCR9SJCLL-low.svg图 2-2 AM6xA 视觉应用数据流

AI 模型运行后,特定应用可以决定如何处理信息,例如通过网络进行通信、在显示屏上显示信息或播放警报声。处于非活动状态时,低功耗模式会显著降低功耗;在 100% 负载下运行时,SoC 在高达 85°C 的温度下功耗不到 3W,从而减少了对主动冷却的需求。器件上的安全功能可防止篡改,从而保护数据和固件 IP。

AM62A 具有内部设计的 2TOPS 深度学习加速器。该加速器包含一个与矩阵乘法加速器 (MMA) 紧密耦合的 256 位 C7x DSP。这种紧密耦合使数据能够快速高效地移动到加速器,从而确保加速器的高利用率。2TOPS 指标是指每秒对 8 位量化矩阵执行的最大运算次数。但是,TOPS 并不是深度学习加速性能的理想指标,因为根据加速器架构,甚至是模型/神经网络架构,1TOPS 的推理时间和功耗可能会有很大不同。因此,查看显示推理速率(每秒帧数)的基准会更有用。