基于纹理的图像字符自动定位技术对比研究 comparative study on texture-based text location techniques in images.pdfVIP

基于纹理的图像字符自动定位技术对比研究 comparative study on texture-based text location techniques in images.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于纹理的图像字符自动定位技术对比研究 comparative study on texture-based text location techniques in images

第11 卷 第2 期 电路与系统学报 Vol.11, No.2 2006 年 4 月 JOURNAL OF CIRCUITS AND SYSTEMS April, 2006 文章编号 1007-0249 (2006) 02-0007-05 * 基于纹理的图像字符自动定位技术对比研究 李晓光 李晓华 沈兰荪 北京工业大学 信号与信息处理研究室 北京 100022 摘要 随着信息技术的迅速发展 基于内容的图像检索技术引起了研究者的广泛关注 自动抽取图像/视频的语义 内容是图像/视频检索中研究的重点和难点 本文通过分析多种字符定位技术 给出了基于纹理分析的字符定位算法的 一般框架 对各种基于纹理分析的字符定位方法进行了对比研究 尤其深入地研究了纹理特征提取 分类器设计及边 界位置确定对定位结果的影响 最后通过预分类的方法对算法进行改进 实验结果表明 该方法在保持正确定位率基 本不变的情况下 可以大幅度提高处理速度 关键词 字符定位 神经网络 支撑向量机 数学形态学 中图分类号 TP391 文献标识码 A 1 引言 随着数字图书馆和多媒体数据库等信息技术的发展 基于内容的多媒体检索技术引起了人们的关 注 图像和数字视频中的文字在客观上包含重要的内容信息 这些信息是组成基于内容多媒体检索的 重要的索引之一 提取这些信息第一步要做的是在图像或视频中将这些字符的位置找出来 这就需要 对图像/视频中字符的自动检测定位技术进行研究 目前已经有多种字符自动定位算法 总体上说 这些方法可以分为两类 一类是基于纹理特征分 [1] 析的方法 即把图像中的文字区域看作具有特定特征的纹理区域 应用各种纹理分析以及模式识别 方法识别文本区 [2] 另一类方法是基于连通域分析方法 首先假设图像中的字符的颜色或灰度级是一 致的或相近的 把图像分解成若干颜色或灰度级范围的层 对各层的图像进行连通域分析 根据文字 区的一些特点进行判断和定位 本文着重对基于纹理的字符定位方法进行了一些对比研究 2 算法整体框架 基于纹理字符定位算法的通用框架如图 1 所示 在该框架中 首先要对图像数据进行特征提取 即提取能够体现文本区域纹理特点的特征向量 并将其作为分类器的分类依据 然后通过分类器把每一像素点分为文本点或非文本点 从而得到与原 图像相应的黑白二值图像 为了消除分类二值图像中的噪音对确定边界造成的干扰 对分类后的图像 进行去噪处理 最后从去噪后的二值图像中确定文字区域的具体位置 输出定位结果 本文对以上算法框架中的各个环节均采用了不同的实现方法进行对比研究 提取灰度 梯度和标 准方差作为特征向量 采用神经网络和支撑向量机分类器进行像素分类 经数学形态学去噪后 采用 投影直方图和连通区域分析法确定文本边界 本文对由各种不同的方法构成的算法方案进行了大量实 验 给出了对比结果并分析各种方案的优劣 最后针对存在的问题 提出改进方案 得到一种综合性 能较好的方法 3 算法描述 图1 基于纹理的字符定位算法通用框图 3.1 特征提取 基于纹理分析的定位方法是把图像中的字符区域看作具有特殊特征的纹理区 依据这些特征进行 * 收稿日期 2003-11-05 修订日期 2004-01-05 基金项目 国家自然基金资助项目 北京市自然基金资助项目 4042008 万方数据 8 电路与系统学报 第11 卷 纹理分割 文本区域纹理具有边缘变化剧烈 对比度强等区别于背景的纹理特征 选取最能体现文本 区这些特征的特征向量作为分类的依据 对分类结果起着举足轻重的作用 本文分

您可能关注的文档

文档评论(0)

qianqiana + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5132241303000003

1亿VIP精品文档

相关文档