ZHCACO4 may 2023 AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1 , AM68A , AM69A
“增强数据集”是指在不增加数据标记负担的情况下,通过添加具有各种噪声和修改的数据副本来人为扩展。如果做得好,增强操作可提高模型的稳健性并避免过拟合。例如,当摄像头聚焦不正确时,添加模糊效果可以提高稳健性;向图像添加旋转有助于引入不属于原始数据集的对象定位。
如果正在为数据集创建训练集和测试集分割,则应在增强之前完成分割,以免污染测试集。有些增强的整体影响可能很小,因此测试和训练图像之间几乎完美匹配。这会不当地提高模型的计算精度。
对于食品识别模型,使用表 2-1 中所示的增强列表。
尺寸/方向变换 | 筛选器/局部效果 | 加法/乘法效应 |
---|---|---|
透视变换 | 高斯模糊 | 高斯噪声 |
左右翻转 | 锐化 | 增加饱和度 |
上下翻转 | 动态模糊 | 更改色温 |
剪切 | 对比度 | 使色调和饱和度倍增 |
透视变换 | JPEG 压缩 | |
旋转 | 自动对比度 | |
锐化 |
并非所有增强都应用于每个图像;对随机子集进行了应用。为每个原始图像创建了八个额外增强版本的图像。这些增强是根据实际情况下看到其影响的可能性来选择的。这并非所有可用和有用增强的详尽列表,但也不仅限于翻转、裁剪、调整大小、旋转、模糊和增加高斯噪声等标准增强。Python 中的 imgaug 库用于应用这些增强并在此过程中保持边界框,以避免附加标记。
鉴于此处允许的增强类型和数量,此数据集被视为“重度”增强。不建议对所有应用使用重度增强,尤其是在图像中的细微变化本身可能被视为图案的应用中,例如机器视觉应用中的缺陷检测。
此应用程序存储库中的 data_manipulation.py Python3 脚本包括用于修改图像、另存为文件以及将图像添加到描述数据标签/注释的 COCO JSON 文件中的源代码。它还包括用于重新处理数据和标签的其他函数,例如,将多个 label-studio 训练会话组合成一个大型数据集,以及将 JSON 标签文件转换为易于操作的中间格式。