ZHCY189 白皮书 | 德州仪器 TI.com.cn

ZHCY189A january 2022 – march 2023 AM67 , AM67A , AM68 , AM68A , AM69 , AM69A , TDA4AEN-Q1 , TDA4AH-Q1 , TDA4AL-Q1 , TDA4AP-Q1 , TDA4APE-Q1 , TDA4VE-Q1 , TDA4VEN-Q1 , TDA4VH-Q1 , TDA4VL-Q1 , TDA4VM , TDA4VM-Q1 , TDA4VP-Q1 , TDA4VPE-Q1

内容概览
Authors
引言
定义边缘 AI
什么是高效的边缘 AI 系统？
1. 选择 SoC 架构
2. 可编程内核类型和加速器
使用 TI 视觉处理器设计边缘 AI 系统
1. 深度学习加速器
2. 成像和计算机视觉硬件加速器
3. 智能内部总线和存储器架构
4. 优化的系统 BOM
5. 易于使用的软件开发环境
结论

成像和计算机视觉硬件加速器

基于视觉的边缘 AI 系统通常包括单摄像头或多摄像头图像处理和传统的计算机视觉任务。在 CPU 或 GPU 中执行这些任务会产生大量功耗，并且存在吞吐量限制。

此类边缘 AI 处理器 SoC 可以在硬件上加速计算密集型低级别强力像素处理视觉任务，例如视觉处理加速器内核中的 ISP、镜头失真校正、多尺度缩放和双边噪声滤波。深度和运动感知加速器内核可以加速立体深度估算和密集光流，有助于增强对环境的感知，如图 3 所示。

图 3 视觉加速器功能

通过在硬件上加速这些任务，可以实现低功耗和小尺寸。尽管这些任务是在硬件中加速的，但其可配置性仍然提供了灵活性，从而可以使用加速器功能来更好地满足您的系统需求。

这种集成和加速可以省去对定制 ISP 或 FPGA 的需求，同时还能释放 CPU 的性能，用于在硬件中处理计算密集型成像和视觉任务。例如，单个视觉处理加速器内核能够以 30fps 的速度处理多达 8 个 200 万像素或 2 个 800 万像素摄像头的数据。深度和运动处理加速内核能够以每秒 8000 万像素的速度进行立体深度估算，并以每秒 15000 万像素的速度处理运动矢量。