碎片图像字符特征提取的方法的研究.docVIP

碎片图像字符特征提取的方法的研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
碎片图像字符特征提取的方法的研究

碎片图像字符特征提取的方法的研究   摘 要 字符特征提取是含文字碎片图像拼接的关键环节,直接影响拼接效果。提出了一种包含文字信息的碎片图像特征提取方法,首先,对原始碎片图像进行预处理,分别得到字符和碎片背景的二值图像;然后,利用边缘检测算子提取字符和碎片背景的单像素边缘;最后,利用结构算子检测碎片图像中字符与碎片背景边缘的交叉点,并根据交叉点的信息提取字体边缘方向特征。仿真实验结果表明本文提出的碎片图像字符特征提取方法思路合理,能够快速、准确地提取出碎片图像中的字符特征,为后续的匹配拼接奠定基础。   关键词 图像拼接;边缘检测;特征提取   中图分类号:TP391 文献标识码:A 文章编号:1671-7597(2014)04-0118-02   图像拼接是一种将多幅相关图像无缝拼接成一幅宽视角全景图像的技术,涉及特征提取及匹配、图像配准和图像融合等理论。包含着文宇、图片等信息的纸张往往会因为各种原因造成破碎,通过人眼比对查找的方式对这些碎片文件进行拼接比较费时费力。将碎片文件通过扫描等方式转化为数字图像,再利用数字图像处理技术进行匹配可以取得较好的拼接效果。碎片图像的拼接可以根据纹理、色彩和轮廓等多种不同特征进行拼接,也可以按碎片中有无目标、形状特征是否规则等进行复原。碎片图像拼接技术能够实现对原始文件或图片信息的还原,可广泛应用。目前,学者们提出了很多碎片图像特征提取方法,如Harris特征提取、基于边缘的特征提取、SIFT特征提取等。针对含文字碎片图像的特点,本文提出了一种有效的字符特征提取方法,该方法能够快速、准确地提取碎片图像中特征点的坐标及字体走向等特征,为碎片图像拼接奠定良好的基础。   1 字符特征提取方法研究   关键特征的提取是碎片图像拼接的核心和难点。因为特征明显的点、线和边缘可以较精确地定位碎片图像边缘连接点坐标和连接线段的角度,所以搜索这些特征明显的点、线和边缘是拼接含字符碎片图像的关键。现在提出的方法主要检测字符与碎片图像背景边缘的交叉点和提取字体边缘方向,主要包括图像预处理、边缘检测、特征提取三个环节。   1.1 预处理   首先,将碎纸片放在黑色台布上扫描得到原始图像,其中黑色部分为台布,白色部分为碎片空白区域,字符区域为绿色。然后,将原始图像转换为灰度图像,并分别利用大律法和自定义阈值法进行二值化和反色处理,提取字符区域(目标)和碎片图像区域(背景)。大律法,即最大类间方差法,根据图像中目标和背景两个类别的可分离性自适应确定分割阈值T,类间方差越大,则表明两类之间灰度差别越大,所以获得最大类间方差的阈值T就是最佳分割阈值。   1.2 边缘检测   边缘检测是字符特征提取的基础,现提出的特征提取方法主要是基于字符轮廓信息,所以边缘检测对碎片图像字符特征的提取起着至关重要的作用,主要包括字符区域提取、去除目标边缘毛刺、提取字符及背景单像素边缘检测等环节。   1.2.1 字符区域提取   字符区域的确定是进行字符特征提取的前提,通过对碎片背景图像和字符图像进行差值运算可以将碎片图像中的字符区域提取出来。开运算具有磨光图像的外边界的优点,所以利用开运算剔除差值图像中的毛刺。为了去除图像中的噪声,对去毛刺图像再进行先腐蚀、后膨胀的运算,得到去除毛刺及噪声的字符图像。   1.2.2 单像素边缘检测   字符与碎片图像边缘的交叉点坐标和字体边缘方向是进行图像拼接的重要特征,而确定字体和碎片图像的边缘是提取这些特征的基础。为了精确计算交叉点坐标和字体边缘方向,可利用单像素边缘检测方法。   1.3 特征提取   字符与碎片背景图像的交叉点坐标和字体边缘方向是用于碎片图像拼接的关键特征。   1.3.1 交叉点检测   首先,将提取出的碎片背景边缘图像和字符边缘图像进行“与”操作,提取二者相重叠的部分。   单像素边缘端点的特点是若端点像素的灰度值为“1”,则只有一个邻域像素的灰度值为“1”,其余7个邻域像素的灰度值均为“0”。其根据单像素边缘端点的这种特性,构造了端点图6字符与背景边缘重叠区域检测的8方向结构算子(如图1),利用这些结构算子对重叠区域图像进行逐点扫描,确定重叠区域的端点,并记录该点的坐标值。   图1 单像素边缘端点检测结构算子   1.3.2 字体边缘方向检测   为了确定字体边缘方向,将字符边缘图像与重叠区域图像作差,得到去除重叠区域的字符边缘图像[如图2(a)]。因为重叠区域边缘端点(Ak,k=1,2,…,N,灰度值为“0”)与字符边缘的端点(Bk,k=1,2,…,N,灰度值为“1”)邻接,所以将Ak作为起点检测字体边缘方向,具体步骤如下。   第1步根据重叠区域边缘端点坐标对的数量,确定碎片图像中重叠区域边缘端点个数N。   

您可能关注的文档

文档评论(0)

151****1926 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档