ZHCACO4 may   2023 AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1 , AM68A , AM69A

 

  1.   1
  2.   摘要
  3.   商标
  4. 1引言
    1. 1.1 目标读者
    2. 1.2 主机信息
  5. 2创建数据集
    1. 2.1 收集图像
    2. 2.2 标记图像
    3. 2.3 增强数据集(可选)
  6. 3选择模型
  7. 4训练模型
    1. 4.1 输入优化(可选)
  8. 5编译模型
  9. 6使用模型
  10. 7构建最终应用
    1. 7.1 使用 TI 的 Gstreamer 插件优化应用
    2. 7.2 使用原始 MIPI-CSI2 摄像头
  11. 8总结
  12. 9参考文献

增强数据集(可选)

“增强数据集”是指在不增加数据标记负担的情况下,通过添加具有各种噪声和修改的数据副本来人为扩展。如果做得好,增强操作可提高模型的稳健性并避免过拟合。例如,当摄像头聚焦不正确时,添加模糊效果可以提高稳健性;向图像添加旋转有助于引入不属于原始数据集的对象定位。

如果正在为数据集创建训练集和测试集分割,则应在增强之前完成分割,以免污染测试集。有些增强的整体影响可能很小,因此测试和训练图像之间几乎完美匹配。这会不当地提高模型的计算精度。

对于食品识别模型,使用表 2-1 中所示的增强列表。

表 2-1 增强列表
尺寸/方向变换 筛选器/局部效果 加法/乘法效应
透视变换 高斯模糊 高斯噪声
左右翻转 锐化 增加饱和度
上下翻转 动态模糊 更改色温
剪切 对比度 使色调和饱和度倍增
透视变换 JPEG 压缩
旋转 自动对比度
锐化

并非所有增强都应用于每个图像;对随机子集进行了应用。为每个原始图像创建了八个额外增强版本的图像。这些增强是根据实际情况下看到其影响的可能性来选择的。这并非所有可用和有用增强的详尽列表,但也不仅限于翻转、裁剪、调整大小、旋转、模糊和增加高斯噪声等标准增强。Python 中的 imgaug 库用于应用这些增强并在此过程中保持边界框,以避免附加标记。

鉴于此处允许的增强类型和数量,此数据集被视为“重度”增强。不建议对所有应用使用重度增强,尤其是在图像中的细微变化本身可能被视为图案的应用中,例如机器视觉应用中的缺陷检测。

此应用程序存储库中的 data_manipulation.py Python3 脚本包括用于修改图像、另存为文件以及将图像添加到描述数据标签/注释的 COCO JSON 文件中的源代码。它还包括用于重新处理数据和标签的其他函数,例如,将多个 label-studio 训练会话组合成一个大型数据集,以及将 JSON 标签文件转换为易于操作的中间格式。