- 1、本文档共48页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于灰度像素理论的碎纸片拼接方法
摘要
常规的二维碎片拼接技术一直受到科研领域重视,它在司法鉴定、文物修复、图像处理等领域有着广泛的应用。本文研究的是二维碎片拼接技术中最典型的文档类碎纸片拼接问题。基于文档纸片色彩明确、方向一致、无重叠等特点,利用灰度理论对问题作出解决。通过图形扫描得到图像,然后通过二值化, 梯度算进行预处理,并运用皮尔逊相关性度量及方差分析算法进行匹配,以实现对纸片进行还原。本文通过MATLAB程序模型,以及图片像素灰度理论实现文档碎片的重新拼接。
对于问题1,应用图像处理技术中的灰度理论建立了灰度模型I。在对得到灰度模型进行梯度边缘化预处理的方法进行模型改进,建立了边缘灰度模型II。然后借助于皮尔逊相关系数算法和MATLAB软件,对附件中所提供的碎片进行排列拼接。
对于问题2,采用化归思想,将二维问题渐变为一维问题。首先归纳碎片特征运用MATLAB软件对碎片进行同行分类,得到11行19列的元素;采用方差分析算法和人工干预对各行中元素进行排列,得到11条横切的图形;采用方差分析算法和人工干预对其进行排列,得以还原。
本文的亮点在于对各行中元素采用方差分析算法进行左侧到右侧匹配后,同时增加了右侧到左侧的匹配检验,大大减少了人工干预的工作。
关键字: 灰度理论;皮尔逊相关系数算法;梯度边缘化;方差分析算法;人工干预
一、问题的重述
问题一、对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达。
问题二、对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。
问题三、上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果。
二、模型的假设
1.所修复的文章必须是一张完整的文章,碎片一定可以拼接成功,并且文章纸张完整;
2.碎纸片的几何尺寸完全相同,边缘清晰,且碎片中字体一致无残缺;
3.在检测是否匹配时,不存在实际中不相接的碎片但匹配度相对较高的情况。
4.附件中数据真实可靠。
三、符号说明
问题分析
问题一的分析:
4.1通过对附件1、附件2进行分析,碎片在外观形状上并无差异,所以若对碎片进行重新匹配,可以简化为对碎片边缘进行匹配。考虑先运用MATLAB中的函数将数据以像素灰度模型(gray-scale model)的形式进行读取。通过对结果和附件的观察不难发现,每片碎片列边缘像素特征较为明显,因此,可以通过比较样本碎片左边与其他待测碎片的右边相关性(Correlation coefficient)大小,得到最近拟合碎片,对右边也进行类似处理。这里采用皮尔逊相关系数理论作为相关性检测的基准。选取相关性度量最高值,可以得到正确的排序序列。最后运用MATLAB中的函数将拼接后的图像进行输出。
问题二的分析:
4.2.1.与一维的区别和联系
I.区别:
1)需要匹配边数由二到四;
2)一边上可用于检测匹配程度的像素点大幅减少;
3)段落的首尾会影响检测时的判别。
II.联系:
1)都可以应用灰度理论转化为数值矩阵后进行分析;
2)可以转化为一维问题,可先化成若干横条,然后11个横条进行匹配或先化成若干纵条,然后19个纵条进行匹配。
4.2.2.二维碎片的图像分析
由图4.2.1可以发现,行间形成的空白区域可视作一条直线,列间形成的空白区域可视作为曲折的直线。并且行间距大于列间距,因此碎片的左右两侧更不容易在碎片中出现白边,白边属于分析匹配程度时的一种特殊情况,会提高分析难度,应尽量避免。另外,由于碎片上下两侧的像素点少于左右两侧,故在单边进行匹配时上下比较更容易出现错误。先成一列的难度较大,先成行较简单,并且成行后横向像素点将增加很多,易于提高成功率,有效减少人工干预。
图4.2.1
4.2.3.归纳可能为一行的所有特征,进行编程监测以得到11行数据。采用方差分析算法对这些数据内部的每列进行排序,得到11条横切的图形。然后采用方差分析算法和人工干预对其进行排列。
问题三的分析:采用类似于问题二的方法对正反面分别排序,将不完整的正反面图进行覆盖,得到较完整图,然后进行人工干预,填入少量未识别碎片,得到拼接结果。
五、模型的建立与求解
问题一
本题考虑到文本图片有别于一般图像,具有色彩稳定,无光照因素
您可能关注的文档
- 基于单片机的锅炉液位控制系统设计毕业设计论文.doc
- 基于单片机的函数发生器本科毕业论文.doc
- 基于单片机的函数发生器的设计与实现_本科毕业论文.doc
- 基于单片机的函数信号发生器毕业设计(论文).doc
- 基于单片机的函数信号发生器毕业设计论文.doc
- 基于单片机的恒流源毕业设计论文.doc
- 基于单片机的恒温箱温度控制系统毕业论文.doc
- 基于单片机的红外防盗系统的硬件设计学士学位论文.doc
- 基于单片机的红外线计时器的设计与实现毕业设计论文.doc
- 基于单片机的红外线自动门控制设计_毕业设计论文.doc
- 2024年吉林省建筑安全员知识题库 .pdf
- 2024-2025学年初中信息技术(信息科技)九年级上册大连理工版(2015)教学设计合集.docx
- 2024-2025学年初中信息技术(信息科技)初中二年级冀教版(2017)教学设计合集.docx
- 南京某系杆拱桥施工组织设计方案.pdf
- 2024-2025学年初中信息技术(信息科技)九年级上册科学版(2018)教学设计合集.docx
- 南京某系杆拱桥施工组织设计方案.pdf
- 2024-2025学年初中信息技术(信息科技)九年级下册川教版(2019)教学设计合集.docx
- 2024-2025学年初中信息技术(信息科技)七年级上册长春版教学设计合集.docx
- 南京某系杆拱桥施工组织设计.pdf
- 2024-2025学年小学英语三年级上册(2024)人教精通版(三起)(2024)教学设计合集.docx
文档评论(0)