CN107481244A 一种工业机器人视觉语义分割数据库制作方法（昆明理工大学）.docxVIP

下载本文档

0
0
约9.14千字
约 15页
2026-03-08 发布于重庆
举报

CN107481244A 一种工业机器人视觉语义分割数据库制作方法（昆明理工大学）.docx

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号CN107481244A

(43)申请公布日2017.12.15

(21)申请号201710535729.2

(22)申请日2017.07.04

(71)申请人昆明理工大学

地址650093云南省昆明市五华区学府路

253号

(72)发明人张印辉张春全何自芬武玉琪张越

(51)Int.CI.

G06T7/11(2017.01)

GO6T7/194(2017.01)

GO6F17/30(2006.01)

权利要求书2页说明书4页附图2页

(54)发明名称

一种工业机器人视觉语义分割数据库制作方法

(57)摘要

CN107481244A本发明涉及一种工业机器人视觉语义分割数据库制作方法，属于数字图像处理技术领域。本发明采集机械零件和工具不同背景、不同样本的图像若干副；将图像中出现的每一种类别的目标区域和背景抠图处理，再进行填充，并对目标区域进行描边操作；再将图像中背景区域和类别区域的像素值归类，将图像转换为cdata格式，将cdata图像与colormap叠加，完成原图像Ground-truth制作。本发明建立的数据库可用于深度学习网络模型训练、验证、检测，完成深度学习网络对常见常用机械零件和工具的检测识别任务；此外能根据实际需要，建立多种类别的数据库，以

CN107481244A

采集图像

RGB图像

PS处理

彩色图转换为灰度图

像素值归类

添加colormap

Groundtruth

CN107481244A权利要求书1/2页

1.一种工业机器人视觉语义分割数据库制作方法，其特征在于：首先，利用图像采集设备采集机械零件和工具不同背景、不同样本的图像若干副；然后将图像中出现的每一种类别的目标区域和背景抠图处理，分别利用一种颜色对目标区域和背景区域进行填充，并对目标区域进行描边操作；再将图像中背景区域和类别区域的像素值分别归为0～5,将图像转换为cdata格式，将cdata图像与colormap叠加，完成原图像Ground-truth制作。

2.根据权利要求1所述的工业机器人视觉语义分割数据库制作方法，其特征在于：所述方法的具体步骤如下：

Step1、首先利用图像采集设备对5种常见机械零件和工具不同背景、不同样本的图像若干副，5种常见机械零件和工具包括轴承、起子、齿轮、钳子、扳手；其次图像采集时利用不同背景、不同数量、相同类别不同样本工具的场景，实现采集得到的图像多样化；

Step2、对采集得到的图像利用PhotoShop软件对图像中出现的不同类别区域抠图，将抠出的区域利用对应的RGB值进行填充和描边处理，将所有背景区域填充为黑色，将图像保存为PNG格式；

Step3、利用Matlab软件对保存的PNG格式的图像进行处理；首先将图像中背景区域和类别区域的像素值分别归为0～5,将图像转换为cdata格式；然后将cdata图像与colormap叠加，并将图像保存为PNG格式；

Step4、将Step2中保存的所有PNG格式的图像批处理；利用Matlab软件循环Step3进行批处理，将多有图像保存为PNG格式，完成原图像Ground-truth制作。

3.根据权利要求1所述的工业机器人视觉语义分割数据库制作方法，其特征在于：所述步骤Step2中，利用PhotoShop软件对图像进行处理的主要步骤如下：

Step2.1、利用PhotoShop软件对图像中出现的不同类别区域抠图，对图像中出现的轴承、起子、齿轮、钳子、扳手区域，利用快速选择工具选择该区域，不同类别的目标区域分别利用“填充”命令分别利用不同的RGB值进行填充；

其中，轴承、起子、齿轮、钳子、扳手所在区域填充的颜色的RGB值分别为(0,128,0)、(128,128,0)、(128,0,0)、(128,0,128)、(0,128,128);

Step2.2、利用“反向选择”命令选择所有背景区域，将背景区域填充为黑色，对应的RGB值为(0,0,0);再次选择目标区域，利用“描边”命令对所有目标区域进行描边，描边颜色为白色，对应像素值为(255,25

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

CN107481244A 一种工业机器人视觉语义分割数据库制作方法（昆明理工大学）.docxVIP