- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于连通区域的标志牌文本提取方法-自然科学版-青岛大学
维普资讯
第 19卷第4期 青 岛大 学 学 报 (自然 科 学版 ) v01.19No.4
2006年 12月 JOURNALOFQINGDAOUNIVERSITY (NaturalScienceEdition) Dec.2006
文章编号:1006—1037(2006)04—0041一O4
基于连通区域的标志牌文本提取方法
乔 甜,付 庆,尹茂东,方 漪,赵志刚
(青岛大学信息工程学院,青岛266071)
摘要:在对各种文本定位与提取方法分析比较的基础上,针对标志牌文本的具体特点,提
出了一种基于连通区域的标志牌文本提取方法——在灰度图像中定位标志牌区域,二值
图像中提取标志牌文本,并用VC++编程实现对采集的 自然场景下的标志牌文本图像
进行了实验,结果证明,该方法能够准确定位并提取 自然场景下的标志牌文本,获得文本
字符。
关键词:标志牌文本;标志牌定位;标志牌文本提取;基于连通区域的方法
中图分类号:TP391.41 文献标识码:A
标志牌文本是一种场景文本,即通过照相机或摄像机得到的真实三维世界中场景文本的二维图像,这些
图像通常有光照不均匀、曝光不足和拍摄角度倾斜等缺点,所以这类文本很难被提取和识别[1]。目前,一些
研究者使用基于边缘的方法提取标志牌文本,但复杂 自然图像中大量的非文本边缘严重影响提取的正确率,
文献[2]中使用形态学的方法检测和提取文本边缘,文献-I3]提出了应用边缘跟踪的原理逐一跟踪图像中的
边缘 ,但增加了运算的复杂度和文本提取的不确定性。基于对各种文本定位与提取方法的分析比较,以及对
标志牌图像特点的归纳,本文中提出了一种有效的基于连通区域的标志牌文本提取方法,该方法可以处理不
同字体、字符大小和不同排列方向的文本,并且对图像拍摄的光照条件、拍摄角度等不敏感,能够得到较好的
提取效果。
1 基于连通区域的文本提取方法
作为一种 自然场景,标志牌文本图像具有其 自身的特点:1)通常文本位于标志牌中心区域,与标志牌底
色对比强烈;2)标志牌背景底色单一,与图像背景对比明显。自然场景下的标志牌文本提取,除了与标志牌
文本图像 自身特征有密切关系,还会受到光线、标志牌周围背景、拍摄角度等相关因素的影响。
基于连接区域方法是文本提取的方法之一,其思想可以这样来描述:一个多值的图像 j有像素值 “E-
{0,1,…,U一1),U是一个比1大很多的整数,可以被分解成一系列的基本图像j一 {j),j是具有相同
值的集合。基于标志牌有相同颜色 (或亮度)的假设,从每个图像中提取连通成分。再对成分的大小、排列部
分所含的数量和线的方向进行启发式限制来定位标志牌,进而提取文本行。如果 j是彩色图像,那么还需要
颜色聚类技术,而对于灰度图像 ,就需要二值处理。使用基于连接的文本提取方法,通过分析边的几何排列
或者分析具有相似的颜色 /灰度的部分来检测文本区域,可以迅速定位并提取标志牌文本L1]。
相对于上述方法,基于纹理的方法和基于边和角点的方法,文本区域定位不准确,基于人工神经网络的
方法和基于支持向量机的方法需要使用样本进行训练,容易产生过学习和欠学习等问题,且实时性差。在对
图像特点归纳和已有方法分析比较的基础上,我们使用基于连通区域的方法,首先确定标志牌所在区域,然
后进行文本提取。算法流程图见图 1。
收稿El期:2006—09—06
作者简介:乔甜 (1981一),女 ,山东枣庄人,硕士研究生,主要研究方向为计算机视觉与图像处理。
维普资讯
42 青岛大学学报 (自然科学版) 第19卷
其中输入图像是拍照手机拍摄的大小为320×240的彩
色图像,按照图l所示流程,最终输出仅含有标志牌文本字符 (原始彩色图像)
的图像,各部分功能模块说明如下:
您可能关注的文档
- 基于TRIZ理论的高新技术企业创新原理研究-创新方法知识管理系统.PDF
- 基于UC3854有源功率因数校正电路的设计.PDF
- 基于人体红外传感器的老年人卧室照明系统的设计-长江大学.PDF
- 基于元胞自动机的城市交通网络模拟模型.ppt.PPT
- 基于UHV-FTRTPS的特高压交流变压器局部放电试验技术.PDF
- 基于光纤导光的数字全息微形变测量系统 来源:21ic电子网 摘要:建立 ....DOC
- 基于光电反馈的固体Nd:YAG激光器强度噪声压缩.PDF
- 基于Multisim 的模拟电子线路课程应用转型改革.PDF
- 基于全局仿射变换估计的航拍视频校正倡-计算机应用研究.PDF
- 基于TMS320F2812完成高精度光电编码器的自动检测方案研究.PDF
- 2025至2030全球与中国优质棉市场销售渠道及未来经营格局研究报告.docx
- 2025至2030冷冻架行业产业运行态势及投资规划深度研究报告.docx
- 2025至2030碳密封圈行业产业运行态势及投资规划深度研究报告.docx
- 2025至2030中国移动式建筑起重机行业运营态势与投资前景调查研究报告.docx
- 2025至2030中国房间分隔器行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030全球及中国农业旅游行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030产学研合作创新行业市场发展现状及发展趋势与投资报告.docx
- 2025至2030中国血管内温度管理系统行业运营态势与投资前景调查研究报告.docx
- 2025至2030中国3D打印假体行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030铝箔容器行业发展趋势分析与未来投资战略咨询研究报告.docx
文档评论(0)