CN107481244A 一种工业机器人视觉语义分割数据库制作方法 (昆明理工大学).docxVIP

  • 0
  • 0
  • 约9.14千字
  • 约 15页
  • 2026-03-08 发布于重庆
  • 举报

CN107481244A 一种工业机器人视觉语义分割数据库制作方法 (昆明理工大学).docx

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号CN107481244A

(43)申请公布日2017.12.15

(21)申请号201710535729.2

(22)申请日2017.07.04

(71)申请人昆明理工大学

地址650093云南省昆明市五华区学府路

253号

(72)发明人张印辉张春全何自芬武玉琪张越

(51)Int.CI.

G06T7/11(2017.01)

GO6T7/194(2017.01)

GO6F17/30(2006.01)

权利要求书2页说明书4页附图2页

(54)发明名称

一种工业机器人视觉语义分割数据库制作方法

(57)摘要

CN107481244A本发明涉及一种工业机器人视觉语义分割数据库制作方法,属于数字图像处理技术领域。本发明采集机械零件和工具不同背景、不同样本的图像若干副;将图像中出现的每一种类别的目标区域和背景抠图处理,再进行填充,并对目标区域进行描边操作;再将图像中背景区域和类别区域的像素值归类,将图像转换为cdata格式,将cdata图像与colormap叠加,完成原图像Ground-truth制作。本发明建立的数据库可用于深度学习网络模型训练、验证、检测,完成深度学习网络对常见常用机械零件和工具的检测识别任务;此外能根据实际需要,建立多种类别的数据库,以

CN107481244A

采集图像

采集图像

RGB图像

PS处理

彩色图转换为灰度图

像素值归类

添加colormap

Groundtruth

CN107481244A权利要求书1/2页

2

1.一种工业机器人视觉语义分割数据库制作方法,其特征在于:首先,利用图像采集设备采集机械零件和工具不同背景、不同样本的图像若干副;然后将图像中出现的每一种类别的目标区域和背景抠图处理,分别利用一种颜色对目标区域和背景区域进行填充,并对目标区域进行描边操作;再将图像中背景区域和类别区域的像素值分别归为0~5,将图像转换为cdata格式,将cdata图像与colormap叠加,完成原图像Ground-truth制作。

2.根据权利要求1所述的工业机器人视觉语义分割数据库制作方法,其特征在于:所述方法的具体步骤如下:

Step1、首先利用图像采集设备对5种常见机械零件和工具不同背景、不同样本的图像若干副,5种常见机械零件和工具包括轴承、起子、齿轮、钳子、扳手;其次图像采集时利用不同背景、不同数量、相同类别不同样本工具的场景,实现采集得到的图像多样化;

Step2、对采集得到的图像利用PhotoShop软件对图像中出现的不同类别区域抠图,将抠出的区域利用对应的RGB值进行填充和描边处理,将所有背景区域填充为黑色,将图像保存为PNG格式;

Step3、利用Matlab软件对保存的PNG格式的图像进行处理;首先将图像中背景区域和类别区域的像素值分别归为0~5,将图像转换为cdata格式;然后将cdata图像与colormap叠加,并将图像保存为PNG格式;

Step4、将Step2中保存的所有PNG格式的图像批处理;利用Matlab软件循环Step3进行批处理,将多有图像保存为PNG格式,完成原图像Ground-truth制作。

3.根据权利要求1所述的工业机器人视觉语义分割数据库制作方法,其特征在于:所述步骤Step2中,利用PhotoShop软件对图像进行处理的主要步骤如下:

Step2.1、利用PhotoShop软件对图像中出现的不同类别区域抠图,对图像中出现的轴承、起子、齿轮、钳子、扳手区域,利用快速选择工具选择该区域,不同类别的目标区域分别利用“填充”命令分别利用不同的RGB值进行填充;

其中,轴承、起子、齿轮、钳子、扳手所在区域填充的颜色的RGB值分别为(0,128,0)、(128,128,0)、(128,0,0)、(128,0,128)、(0,128,128);

Step2.2、利用“反向选择”命令选择所有背景区域,将背景区域填充为黑色,对应的RGB值为(0,0,0);再次选择目标区域,利用“描边”命令对所有目标区域进行描边,描边颜色为白色,对应像素值为(255,25

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档