- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华南理工大学学报(自然科学版)
第40卷第8期 JournalofSouthChina of V01.40NO.8
UniversityTechnology
Science 2012
2012年8月 (Natural Edition) August
自然场景图像中基于视觉显著性的文本区域检测冰
闵华清 郑华强 罗荣华+
(华南理工大学计算机科学与工程学院,广东广州510006)
摘要:从自然场景图像中抽取文本信息有利于场景图像的内容分析.文中根据图像中
文本通常在局部区域具有显著性的特点,提出多尺度包围盒视觉显著性模型,并利用该模
型设计一种可以融合边缘和纹理信息的候选文本检测方法.首先在Lab颜色空间构造基
于边缘和纹理信息的图像同质性,并利用它将图像映射到同质性空间;然后根据多尺度包
围盒视觉显著性模型求Lab颜色空间的同质性均值图像;最后求同质映射图像与同质性
均值图像的加权欧氏距离,将其作为显著性度量,以提取文本区域.自然场景图像的实
验表明:与单纯利用边缘检测或同质性映射进行文本检测的方法相比,文中提出的方法能
够更好地抑制背景的干扰,这有利于进一步将文本区域与背景剥离,进行更精确的文本
定位.
关键词:文本检测;视觉显著性;同质性;图像分割
中图分类号:TP391.43
自然场景图像中的文字包含了很多重要的语义 符具有相似的颜色和亮度,并且与背景区域的颜色
信息,如路牌上的街道名字、商店招牌上的店名、 存在较大差异的基础上,采用自底向上的方法从图
广告牌上的文字、产品包装上的文字等,这些文本字 像中提取连通区域,然后利用几何约束构造启发式
符对场景视觉信息的表达具有重要价值,是描述和 规则进行连通域分析,将子区域合并得到最终的文
理解场景内容的关键线索.因此,将场景图像中的文
字抽取出来,有利于场景图像的内容分析,可以广泛 向的射线对边缘图像进行笔画宽度变换,然后在笔
应用于机器人视觉和盲人导航等领域,而候选文本 画宽度变换图像中进行联通域分析,过滤不符合规
检测用于确定场景图像中的候选文本区域,是进行 则的非文本区域,获得最终的文本区域.基于边缘特
精确的文本抽取的前提,具有重大的理论意义和实 征的方法是利用文本区域具有丰富的边缘信息这一
用价值. 特点进行文本区域检测,首先采用某种边缘检测算
文本检测的主要方法有基于连通域的方 子从原图像中检测出边缘,然后通过形态学方法将
法¨。2o、基于边缘特征的方法∞’41和基于纹理的方 边缘连接成文本块,最后利用一些启发式规则进行
法∞。6J.基于连通域的方法是在假设同一区域的字 筛选,得到最终的文本区域.张引等o综合考虑各
收稿日期:2011—11—18
(2012ZZ0067)
华南理工大学学报(自然科学版) 第40卷
颜色分量,采用欧氏距离设计出一个新的彩色图像 Achanta等¨纠利用最大对称包围矩形提出一种
边缘检测算子,在背景复杂的图像中进行文本区域 “中心一周围”对比的视觉显著性模型(Achanta视
检测,取得了较好的效果.基于纹理的方法把文本区 觉显著性模型).该模型在Lab颜色空间中首先利
域看作是一种可与背景区分开的特殊的纹理,通常 用5X5二项式内核的高斯滤波器进
文档评论(0)