切割文字全等矩形图片拼接算法设计和实现.docVIP

切割文字全等矩形图片拼接算法设计和实现.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
切割文字全等矩形图片拼接算法设计和实现

切割文字全等矩形图片拼接算法设计和实现   摘 要:全等矩形破碎文字图片拼接还原技术是一种特殊的图片拼接复原技术,其处理的图片具有明显几何规律。通过数据挖据得到图片中所有文字占据连续像素行的平均行数、图片中两行文字间的间距(行距)占据的连续像素行的平均行数,以及每张图片所包含的文字和行距之间的交替规律即行信息向量,并对图片边沿进行二值化处理。还原技术通过对图片的行信息向量进行聚类分析,采用二值特征的Tanimoto测度,得出每行图片的排列顺序。最终得出所有图片的排列顺序,并将所有图片按照该顺序拼接,即可实现图片的拼接还原。   关键词:破碎图片;图片拼接;数据挖掘;模式识别;Tanimoto测度   DOIDOI:10.11907/rjdk.151506   中图分类号:TP312   文献标识码:A 文章编号文章编号2015)009006105   0 引言   破碎文件的拼接还原在复原司法物证、修复历史文献及获取军事情报等领域有着重要应用。人工完成拼接复原,虽然准确率高,但效率很低。尤其当碎片数量庞大时,采用人工拼接复原几乎不可能在短时间内完成。随着计算机技术的发展,可以利用计算机实现破碎文件的自动拼接还原,以提高拼接复原效率。这是图像处理与模式识别领域中的一个新颖且典型的应用,它通过扫描和图像提取技术获取一组全等大小矩形碎纸片的颜色、形状等信息,然后利用计算机进行相关处理,从而实现对这些碎纸片的半自动或全自动拼接还原。   在进行拼接前将所有的小碎片放正(即上下不颠倒)扫描录入,并对每一个录入的图片进行唯一编号,然后导入计算机。处理对象为采用数字阵列表示的位图,通常有BMP、JPG、GIF等格式。   1 数字图像表达   一幅数字图像可以视为一个二维函数f(x,y),在平面中的任意一对坐标(x,y)上的幅值f称为该点图像的灰度、亮度或强度。一个大小为M×N的数字图像是由M行N列的有限元素组成,每个元素都有特定的位置和幅值,代表其所在行列位置上的图像物理信息,如灰度、彩色等。这些元素称为图像元素或像素。每个像素只有黑白两种颜色的图像称为二值图像。在二值图像中,像素只有0和1两种取值,用0表示黑,用1表示白,而介于黑色与白色之间的颜色深度,构成灰度图像,这类图像通常显示为从最暗黑色到最亮白色的灰度,每种灰度称为一个灰度级,通常用L表示。在灰度图像中像素的取值范围为0~L-1且为整数。根据类型的不同,可能有256种或2k种取值,当k=1时,为二值图像。本文使用的像素之间绝对位置的坐标约定,如图1所示。   图1 像素之间绝对位置的坐标约定   将物理图像转化成数字矩阵后,数字图像的矩阵表示如式(1)所示:   f(y,x)=f(0,0)…f(0,N-1)………f(M-1,0)...f(M-1,N-1)(1)   在矩阵f(y,x)中,采用的表示方式是纵坐标y(对应行下标),横坐标x(对应列下标)。通过软件完成对图像的处理实质上是通过计算机修改图像的像素矩阵。通过Matlab图像处理工具箱(Image Processing Toolbox,IPT)调用imread函数,获取图像底层数据即像素矩阵,通过imwrite函数将底层数据写入对应格式的图片中。破碎图片的拼接还原,即通过对底层数据进行数据挖掘,再通过一系列算法进行处理,最终确定每张图片的对应位置,最后定义一个更大的像素矩阵,将所有图片的底层数据写入到矩阵的对应位置,从而完成图片的拼接复原。   2 图片预处理   将待处理图片全部导入Matlab后,对所有图片进行编号,得到n张图片。原始图片如图2所示。   图2 原始图片导入编号   首先,获取每张图片的像素矩阵Ai(M×N)(i表示编号为i的图片,M×N表示数字图像由M行N列的有限元素组成)。图3展示了待处理小图片“001”号的部分像素矩阵(“上”字的局部)。每张图片的像素矩阵都是一个180×72的矩阵。   图3 小图片001号及其像素矩阵部分   根据每张图片的像素矩阵,得到每张图片像素矩阵中哪些行和列为全白,哪些行和列表示有字迹存在。根据这些信息可以直接筛选出那些可能为最顶端位置的图片和最左边、最底端及最右边的图片。   为得到图片的空白行信息,需构造一个M行的列向量a=(r0,...,rM-1)T,ri=0或1,i=0,...,M-1。当矩阵A第i行的所有元素全表示最亮白色的灰度时,ri=1,否则ri=0。在算法中,对矩阵的每一行进行遍历,每一行中只要有一列(一个元素)的值不是灰度信息最大(2k-1)值(示例图像灰度最大值为255(28-1)),则将向量a的相应行的值记为0,表示该行不为空白行或该行中有文字信息体现。如果矩阵该行的所有元素值都是灰度

文档评论(0)

151****1926 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档