ZHCACO4 may   2023 AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1 , AM68A , AM69A

 

  1.   1
  2.   摘要
  3.   商标
  4. 1引言
    1. 1.1 目标读者
    2. 1.2 主机信息
  5. 2创建数据集
    1. 2.1 收集图像
    2. 2.2 标记图像
    3. 2.3 增强数据集(可选)
  6. 3选择模型
  7. 4训练模型
    1. 4.1 输入优化(可选)
  8. 5编译模型
  9. 6使用模型
  10. 7构建最终应用
    1. 7.1 使用 TI 的 Gstreamer 插件优化应用
    2. 7.2 使用原始 MIPI-CSI2 摄像头
  11. 8总结
  12. 9参考文献

标记图像

深度学习和神经网络是受监控 的机器学习算法。这些算法要求数据具有关联的标签,用于告知训练,数据中有哪些相关信息。标签类型取决于要解决的问题的类型。对象检测模型需要坐标(通常为两个 2D 点,表示边界 框)和对象类型;一个图像中可以有多个坐标。对于零售扫描仪应用,这是正确的选择,因为这种应用的部分目的是快速自动识别多个物体。

遗憾的是,标记通常是一项乏味的任务。如果做得不好,模型精度将会受到影响。有几种工具可简化此过程。TI 的 Edge AI Studio 是一款在线云工具,用于为 TI 处理器执行标记和大多数其他模型开发任务;但是,在零售结算应用的开发过程中,此工具不可用。离线/局部标签的替代工具是“label-studio”,标签界面如图 2-2 所示。此图显示了食品识别数据集中的一个图像。存在多个对象,并且这些对象上绘制有彩色框,以指示它们所属的类。

GUID-20230424-SS0I-XXHD-NPVZ-HS3GDZ7ZWPNP-low.jpg图 2-2 Label Studio 界面。(有意将其他对象保留在图像中并取消标记。允许干扰可提高稳健性和精度。)

标记完所有图像后,数据集可以多种格式之一导出。TI 的训练工具使用 COCO JSON 格式。对于此格式,输出是一个 ZIP 存档文件,其中包含一个图像文件夹和一个名为 result.json 的 JSON。