ZHCACO4 应用手册 | 德州仪器 TI.com.cn

ZHCACO4 may 2023 AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1 , AM68A , AM69A

2.2 标记图像

深度学习和神经网络是受监控 的机器学习算法。这些算法要求数据具有关联的标签，用于告知训练，数据中有哪些相关信息。标签类型取决于要解决的问题的类型。对象检测模型需要坐标（通常为两个 2D 点，表示边界框）和对象类型；一个图像中可以有多个坐标。对于零售扫描仪应用，这是正确的选择，因为这种应用的部分目的是快速自动识别多个物体。

遗憾的是，标记通常是一项乏味的任务。如果做得不好，模型精度将会受到影响。有几种工具可简化此过程。TI 的 Edge AI Studio 是一款在线云工具，用于为 TI 处理器执行标记和大多数其他模型开发任务；但是，在零售结算应用的开发过程中，此工具不可用。离线/局部标签的替代工具是“label-studio”，标签界面如图 2-2 所示。此图显示了食品识别数据集中的一个图像。存在多个对象，并且这些对象上绘制有彩色框，以指示它们所属的类。

图 2-2 Label Studio 界面。（有意将其他对象保留在图像中并取消标记。允许干扰可提高稳健性和精度。）

标记完所有图像后，数据集可以多种格式之一导出。TI 的训练工具使用 COCO JSON 格式。对于此格式，输出是一个 ZIP 存档文件，其中包含一个图像文件夹和一个名为 result.json 的 JSON。