CN115546794B 一种基于深度学习和ocr技术的圆形仪表表盘校正方法 (华南理工大学).docxVIP

CN115546794B 一种基于深度学习和ocr技术的圆形仪表表盘校正方法 (华南理工大学).docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN115546794B(45)授权公告日2025.07.04

(21)申请号202211144560.5

(22)申请日2022.09.20

(65)同一申请的已公布的文献号申请公布号CN115546794A

(43)申请公布日2022.12.30

(73)专利权人华南理工大学

地址510640广东省广州市天河区五山路

381号

(72)发明人曲烽瑞安毅杜启亮王昭霖

田联房

(74)专利代理机构广州市华学知识产权代理有限公司44245

专利代理师冯炳辉

(51)Int.CI.

GO6V30/148(2022.01)

G06T7/136(2017.01)

GO6V10/25(2022.01)

GO6V10/44(2022.01)

(56)对比文件

CN111401358A,2020.07.10

CN111488874A,2020.08.04

审查员董雪

权利要求书2页说明书6页附图4页

(54)发明名称

实例分割深度学习模型提取仪表的表盘ROI图像和掩膜ROI

实例分割深度学习模型

提取仪表的表盘ROI图

像和掩膜ROI图像

利用射影变换对仪表表盘进行倾斜校正

OCR文本检测深度学习模型对表盘ROI图像进行字符检测

利用字符区域的四边形边界框对仪表表盘进行旋转校正

(57)摘要

B本发明公开了一种基于深度学习和OCR技术的圆形仪表表盘校正方法,包括:利用实例分割深度学习模型获取仪表的表盘ROI图像和对应的图像掩膜,通过检测图像掩膜的中的表盘轮廓并进行椭圆拟合,按照将椭圆表盘映射为圆形的思路,利用射影变换实现仪表表盘的倾斜校正,再利用OCR文本检测深度学习模型获取仪表图像中的字符区域信息并进一步计算仪表表盘斜率,从而实现仪表图像的旋转校正。本发明具有不依赖模板、通用性强、充分利用仪表自动读数系统中的现有模型等优点,为解决仪表自动读数识别问题中的仪表表盘校正问题提供了一种通用、有效

B

CN115546794的解决方

CN115546794

CN115546794B权利要求书1/2页

2

1.一种基于深度学习和OCR技术的圆形仪表表盘校正方法,其特征在于,包括以下步

骤:

1)收集巡检场景图像,对其中的仪表表盘进行实例分割数据标注,制作数据集并训练用于提取仪表表盘的实例分割深度学习模型;收集仪表表盘图像,对表盘上的字符进行OCR数据标注,制作数据集并训练用于提取仪表图像字符区域的OCR文本检测深度学习模型;

2)输入巡检场景图像于实例分割深度学习模型,模型推理得到仪表表盘中字符区域的矩形边界框和图像掩膜,利用所述矩形边界框对巡检场景图像和图像掩膜进行裁剪,得到仅包括仪表表盘部分对应的子图,称为表盘ROI图像和掩膜ROI图像;

3)对所述掩膜ROI图像进行表盘轮廓提取,并对得到的表盘轮廓进行椭圆拟合;利用平面几何知识,基于椭圆拟合结果得到的参数计算该椭圆的长轴点和短轴点坐标;

4)沿短轴方向寻找距离椭圆圆心为半长轴距离的两点作为两短轴点校正后的期望特征点,求得射影变换矩阵;

5)利用上述射影变换矩阵对表盘ROI图像进行射影变换,以实现仪表表盘的倾斜校正;

6)将倾斜校正后的表盘ROI图像输入OCR文本检测深度学习模型,推理得到表盘ROI图像中字符区域的四边形边界框,依据所述四边形边界框的参数计算仪表表盘斜率;

7)将仪表表盘斜率转化为角度值,称为仪表表盘旋转角,以仪表表盘的圆心为旋转中心,对表盘ROI图像反向旋转仪表表盘旋转角的角度,即可得到旋转校正的表盘ROI图像,从而实现仪表表盘的旋转校正;

8)对旋转校正的表盘ROI图像进行后处理,得到最终校正后的表盘ROI图像。

2.根据权利要求1所述的一种基于深度学习和OCR技术的圆形仪表表盘校正方法,其特征在于,在步骤1)中,所述实例分割深度学习模型为卷积神经网络,输入一幅巡检场景图像,输出巡检场景图像中待检测仪表的仪表表盘区域矩形边界框和图像掩膜,所述图像掩膜指对仪表表盘能够进行覆盖和实现像素级分割的二值图像;所述矩形边界框指包含仪表表盘的最小外接矩形,用矩形边界框中心点坐标(x,y)和矩形边界框的宽W、高H来表示,描述了输入实例分割深度学习模型的巡检场景

您可能关注的文档

文档评论(0)

aabbcc + 关注
实名认证
文档贡献者

若下载文档格式有问题,请咨询qq1643702686索取原版

1亿VIP精品文档

相关文档