碎纸片的拼接复原重点.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
碎纸片的拼接复原 摘 要 碎纸自动拼接技术是图像处理与模式识别领域中的一个较新但是很典型的应用。它是通过扫描图像提取技术获取一组碎片的信息,然后利用计算机进行相应的处理从而实现对这些碎纸片全自动拼接还原。拼接碎片前需对碎片内图像进行二值化处理,一般利用Sobel梯度算子或其他梯度算子对碎片图像进行处理,以获取文字边界。本文通过建立直角坐标系的模型来解决碎片拼接复原。在解决附件1至附件5中碎片的拼接问题时主要采用了建立直角坐标系、数组的方法。对于边界为非规则的碎纸片采用拟合轮廓曲线的方法。考虑到附件1、附件2中的碎片是纵切,其坐标具有横坐标不变纵坐标相反的关系,其拼接结果见附录中表一、表二。在处理附件3、附件4时由于碎片是经过纵切与横切行成的,首先采用处理附件1、附件2的方法再设定横坐标不变纵坐标相反的方法进行自动拼接复原,其拼接结果见附录中表三、表四。在处理附件5中的碎片时因为碎纸片是双面的利用扫描仪对碎纸片进行扫描,保证碎纸被扫描的一面在原始位置中属于同一面。为了提高背景分割的精度,对同一次扫描,使用相同的背景颜色,将扫描结果以图象的形式保存。再采用处理附件3、4的方法进行求解,其拼接结果见附录中表五。1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达(见【结果表达格式说明】)。 2、对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,写出干预方式及干预的时间节点。复原结果表达要求同上。 3、上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。尝试设计相应的碎纸片拼接复原模型与算法,并就附 件5的碎片数据给出拼接复原结果,结果表达要求同上。 二、模型假设 1、碎纸片的大小相同。 2、碎纸片边界的交点,只有同一个字被拆开后的边界坐标的横坐标互为相反数(不变),纵坐标不变(互为相反数)。 坐标的刻度值为单位1。 三、符号说明 、表示累计概率函数; 、表示具体的灰度级数; 、表示原始图像中第级的灰度值; 、表示第级灰度值在原始图像的比例; 、表示原始图像中灰度值为的像素个数; 、表示不同灰度值级数其范围; 、表示碎片像素高度; 四、模型的建立与求解 4.1、具体模型建立及思路见如下流程图: 4.2、碎纸图像的获取及数据的入库管理 利用扫描仪对碎纸片进行扫描,保证碎纸被扫描的一面在原始位置中属于同一面。为了提高背景分割的精度,对同一次扫描,使用相同的背景颜色,将扫描结果以图象的形式保存下来。对原始图像一次进行直方图均衡化和图像滤波处理,再使用8领域方向链码的方法从背景模板中提取得到全部碎片图像原始图像为,直方图均衡化处理后的图像为,两者尺寸均为,的灰度级变化范围是。 首先,求出原始图像的灰度直方图,用256维的向量表示,被称为累计概率函数,则: , . 其中,指具体的灰度级,其取值范围是,是原始图像中第级的灰度值,是第级灰度值的原始图像中所占的比例,为原始图像中灰度值为的像素个数,为原始图像进行均衡化映射,当原始图像时,则: 当时,。 当时,。 其中,是指不同灰度级数,其取值范围是。 4.3、分割方法以及文字行方向的确定。 拼接碎片前需对碎片内图像进行二值化处理,一般利用Solbe梯度算子或其他梯度算子对碎片图像进行处理,以获取文字边界,进而获取碎片内文字行方向、高度、间距等文字行特征,梯度大于给定阈值的点取 黑色,否则取白色。对灰度图像的区域值分割就是先确定一个处于图像灰度值范围之中的灰度阈值,然后将图像中各个像素的灰度值都与这个阈值相比较,并根据比较结果将对应的像素分为两类。这两类像素一般分属图像的两类区域,从而达到分割的目的。从该方法中可以看出,确定一个最优阈值是分割的关键。现有的大部分算法都是集中在阈值确定的研究上。阈值分割方法根据图像本身的特点,可分为单阈值分割方法和多阈值分割方法;若根据分割算法所有的特点或准则,还可以分为直方图与直方图变换法、最大类空间方差法、最小误差法与均匀化误差法、共生矩阵法、最大熵法、简单统计法与局部特征发、概率松弛法、模糊集法、特征空间聚类法、基于过渡区的阈值选取法等。 为提高分析的准确性,假设未碎纸片的文字行方向沿水平方向,文字为汉字,汉字与汉字之间有间隔,汉宽度与高度比值。这意味着每个文字图像与其他文字图像之间有空白点。碎片内文字图像经上述预处理后,再采用下述扫描算法可获取碎片内的文字行方向: (1) 以碎片内某点作为坐标原点,水平方向作为X坐标轴方向,垂直方向作为坐标

文档评论(0)

南非的朋友 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档