ZHCAFY6 November   2025 AM62A3 , AM62A7 , AM67A , TDA4VM

 

  1.   1
  2.   摘要
  3.   商标
  4. 1简介
  5. 2C7xMMA 高速缓存结构
  6. 3为编译的 TIDL 模型进行 DDR 读取/写入分析建模
  7. 4模型优化
    1. 4.1 简单结构模型
    2. 4.2 复杂结构
      1. 4.2.1 残留结构
      2. 4.2.2 并行分支合并
  8. 5总结
  9. 6参考资料

总结

DDR 带宽的模型优化主要涉及减小每层特征映射大小和增加深度。对于复杂的结构,DDR 带宽消耗可能无法避免。TI 的 Model Zoo 提供了许多经过优化和验证的模型和骨干架构。考虑到通用架构的成熟度,可以考虑使用 TI 优化的版本来替换模型的骨干架构,以实现快速改进。

本文档详细介绍了分析模型 DDR 带宽消耗并优化模型以降低带宽消耗的方法。这些内容与 TDA4x、AM6xA 系列 SoC 和 TIDL 推理框架的用户密切相关。应用这些方法通常可获得经过优化的模型,这些模型仅在输入和输出时占用带宽,从而为整个系统释放大量资源。