【开源交流】一种针对单色图表的数据集增广技术(Python)
开源项目:一种针对单色图表的数据集增广技术
编程语言:Python
技术介绍:
本技术采用了多种图像处理方法组合以用于扩充数据集。通常的处理方法有水平翻转、垂直翻转、剪裁、按照角度旋转、高斯模糊、普通模糊、边缘增强、锐化、平滑、反色、细节增强等。
本技术中的数据集扩充算法是一种11倍扩充算法,其执行的具体流程如下。
步骤1:读取指定目录中的所有图片格式文件;
步骤2:将目录中第n张图片读入内存;
步骤3: 对图片进行随机剪裁处理并输出图片;
步骤4:对图片进行旋转处理并输出图片;
步骤5: 对图片进行高斯模糊处理并输出图片;
步骤6:对图片进行普通模糊处理并输出图片;
步骤7:对图片进行边缘增强处理并输出图片;
步骤8:对图片进行锐化处理并输出图片;
步骤9:对图片进行平滑处理并输出图片;
步骤10:对图片进行细节处理并输出图片;
步骤11: 返回步骤2读取下一张图片。
在上述流程中,步骤3中的随机剪裁是指对图片四个边分别随机剪裁1%-10%的像素;步骤4中的旋转处理是指将图片分别进行-2°、-1°、1°、2°四个不同角度的旋转。
此类数据集扩充方法基本适用于所有散点图、柱状图、折线图等图标分类的深度学习算法。
开源依据:《数效科学技术研究院(佛山)有限公司开源平台及合作交流管理制度》
开源日期:2021年7月15日
开源文件:
- 上一篇:研发战略布局“创新平台”数效科院与华南前沿院共建联合研究基地 2022/8/3
- 下一篇:祝贺我单位成功取得国家知识产权局颁发“商标注册证” 2022/3/26