ZHCACO4 应用手册 | 德州仪器 TI.com.cn

ZHCACO4 may 2023 AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1 , AM68A , AM69A

2.3 增强数据集（可选）

“增强数据集”是指在不增加数据标记负担的情况下，通过添加具有各种噪声和修改的数据副本来人为扩展。如果做得好，增强操作可提高模型的稳健性并避免过拟合。例如，当摄像头聚焦不正确时，添加模糊效果可以提高稳健性；向图像添加旋转有助于引入不属于原始数据集的对象定位。

如果正在为数据集创建训练集和测试集分割，则应在增强之前完成分割，以免污染测试集。有些增强的整体影响可能很小，因此测试和训练图像之间几乎完美匹配。这会不当地提高模型的计算精度。

对于食品识别模型，使用表 2-1 中所示的增强列表。

表 2-1 增强列表

尺寸/方向变换	筛选器/局部效果	加法/乘法效应
透视变换	高斯模糊	高斯噪声
左右翻转	锐化	增加饱和度
上下翻转	动态模糊	更改色温
剪切	对比度	使色调和饱和度倍增
透视变换	JPEG 压缩
旋转	自动对比度
	锐化

并非所有增强都应用于每个图像；对随机子集进行了应用。为每个原始图像创建了八个额外增强版本的图像。这些增强是根据实际情况下看到其影响的可能性来选择的。这并非所有可用和有用增强的详尽列表，但也不仅限于翻转、裁剪、调整大小、旋转、模糊和增加高斯噪声等标准增强。Python 中的 imgaug 库用于应用这些增强并在此过程中保持边界框，以避免附加标记。

鉴于此处允许的增强类型和数量，此数据集被视为“重度”增强。不建议对所有应用使用重度增强，尤其是在图像中的细微变化本身可能被视为图案的应用中，例如机器视觉应用中的缺陷检测。

此应用程序存储库中的 data_manipulation.py Python3 脚本包括用于修改图像、另存为文件以及将图像添加到描述数据标签/注释的 COCO JSON 文件中的源代码。它还包括用于重新处理数据和标签的其他函数，例如，将多个 label-studio 训练会话组合成一个大型数据集，以及将 JSON 标签文件转换为易于操作的中间格式。