- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学建模2013B题优秀论文.
融入FFT的综合评价的碎纸片拼接复原
摘要
破碎文件的拼接有很广阔的应用前景,如今计算机技术已逐步取代传统的人工拼接,成熟的碎纸片自动拼接技术能大幅提高拼接复原效率,尤其在文件数目较多的情况下,其优势愈加明显。本文建立了一种碎纸半自动拼接算法,在中英文单面纵向切片、乱序中英文单面纵向切片、中英文单面纵横切片及英文双面纵横切片上都有不错的表现。
问题一:对于中英文单面纵向切片的恢复,本文首先分别用基于0-1二值矩阵的边缘比对法和基于FFT信号处理的互相关系数模型对给定的附件1、2进行了匹配,再发掘了第二种方法的优势,对上下顺序不定的中英文单面纵向切面进行了正确的匹配。这三次自动匹配的准确率均为100%,且用时均小于1秒。
法一:本文首先用MATLAB对附件1、2中的碎片编码,转为二值矩阵。之后利用边缘列碎片的空白确定最左边的一列碎片,之后利用边缘比对一致的像素点数目的多少,按照数目最多的原则匹配出其相邻碎片,逐步实现了中英文单面纵向切片的碎纸拼接。
法二:编码方式同上,本文将二值矩阵的左右边缘自上到下看作一列时域中的数字信号,通过FFT快速傅里叶变换算法得到该信号的频谱特征,利用归一化互相关系数衡量出信号的频谱特征的相关性,按照相关性最大的原则对边缘碎片依次匹配。最终该方法全自动地完全正确地实现了中英文单面纵向切片的碎纸拼接。
对于上下顺序不定中英文单面纵向切片,本文利用了傅里叶变换的物理特性。因为频域中的信号不受扫描顺序的先后影响。所以方案二可以对乱序的碎片进行快速排序,优于方案一。
问题二:对于中英文单面横纵切片的恢复,本文利用综合评价法分别进行行与列的匹配,这两次的结束均进行了一次人工干预,两种算法的运行时间分别为5.5s与5.7s,最终正确率分别为90.4%和82.8%。
对于上述两种方法,本文均先确定出图像左右边缘列的碎片,之后从中随机选择碎片作为行匹配的标志。对于中文,行的划分依据是汉字的中心纵坐标;对于英文,行的划分依据是字母的下端基线。利用行匹配将所有的碎片分行。此处的评价指标为问题一中两种方案评价结果的综合,对待匹配的碎片时域和频域均提出了较高要求,提高了匹配率。按照这个指标对碎片进行行匹配。用每个碎片的左右两个边分别与左右边缘的两边进行匹配,选取其中得分最高的完成匹配,重复直至完成行匹配。对其结果进行人工干预。之后进行间排序,对结果再进行一次人工干预,完成碎片的复原。
问题三:对于英文双面横纵切片的恢复,本文主要沿用了问题二的解法,并进行了适当修改,同样的两次人工干预。其匹配时间为20.3s,准确率为84.7%。
对附件5进行观察,发现同一碎片的a、b两面字母的基线完全相同,因此在列匹配后,仅对所有末位为a的碎片进行行分类。之后从任意一侧开始匹配,分别计算正正与反反、正反与反正,这两种情况的综合评价值之和,选取最高的进行匹配,并利用综合评价值的大小做出正反匹配。行匹配结束后,进行一次人工干预。随后按照之前的方法进行行间排序,随后再进行一次人工干预,得出预期结果。
最后,本文指出了实际中碎纸恢复的拓展,它们均可通过本文算法的改进去实现。
关键字:边缘比对法 FFT 互相关系数 综合评价
问题重述
破碎文件的拼接在司法物证复原、历史文献修复获取等领域都有重要的应用。传统上,复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸的自动拼接技术,以提高拼接效率。对于给定的来自同一页的片,建立碎纸拼接算法针对附件1给出的数据进行复原对于碎纸机纵切横切的情形,模型和算法针对附件给出的数据进行复原。从现实出发,模型与算法
本题需要我们建立模型设计出算法,实现几类破碎文档的拼接。主要有以下几类问题需要解决:中英文文档仅被纵切、中英文文档分别被横切和纵切以及双面英文文档被横纵切割。
要解决本问题,主要的思路就是要找出两张拼接碎片之间的特征,因为在本题中所提供的文档都切成了规整的矩形,所以在拼接碎片的时候,主要考虑文字段落之间的特征。根据我们对文字观察,可以发现:一份文件的字体以及字号大小是一样的,相邻两个碎片直接接壤处的信息相似或者几乎相等,还有一行文字之间也有一些相似性。根据这些文字特征,来解决配对问题。当然,如果能够建立一个普适的模型,是理想状态,但是中英文汉字还是有比较大的区别,所以在这里还是分别对每种情况设计算法。
问题一:
对于中英文单面纵向切片的恢复,分别用基于0-1二值矩阵的边缘比对法和基于FFT信号处理的互相关系数模型对给定的附件1、2进行匹配。
思路一:用MATLAB从附件1、2中的碎片提取出灰度矩阵,再对其按照RGB值进行0-1编码,转为二值矩阵。之后利用边缘列碎片的空白,最左边的一列碎片,之后利用边缘比对一
您可能关注的文档
- 数学实验(MATLAB版韩明版)2.1-2.4部分答案..doc
- 数学实验“线性方程组的最速下降法与共轭梯度法解法”实验报告(内含matlab程序代码)..doc
- 数学实验之数值仿真..docx
- 数学实验实验报告二答案..doc
- 数学学院团总支申报材料..doc
- 数学实验回归分析..docx
- 数学实验全部答案..doc
- 数学实验报告-线性规划..doc
- 数学实验报告(新)1-6..doc
- 数学实验报告tzx..doc
- 2025年综合类-接触网工考试-高级接触网工历年真题摘选带答案(5卷单选题100题).docx
- 2025年住院医师规范培训(各省)-广西住院医师妇产科历年参考题库含答案解析(5卷单选100题).docx
- 2025年综合类-口腔医学技术(士)-口腔医学技术士相关专业知识历年真题摘选带答案(5卷单选题100.docx
- 2025年医学高级职称-麻醉学(医学高级)历年参考题库含答案解析(5卷单项选择题100题).docx
- 2025年安防生产行业技能考试-高校实验室安全考试历年参考题库含答案解析(5套共100道单选合辑).docx
- 2025年综合类-液氯工考试-液氯初级工历年真题摘选带答案(5卷单选题100题).docx
- 2025年卫生资格(中初级)-微生物检验技术(师)历年参考题库含答案解析(5卷100题).docx
- 2025年经济类-中级经济师-中级经济师(建筑经济)历年真题摘选带答案(5卷单选题100道).docx
- 2025年住院医师规范培训(各省)-江苏住院医师肾脏内科历年参考题库含答案解析(5卷单选一百题).docx
- 2025年综合类-中医妇科(医学高级)-中西医结合外科(医学高级)-外科学基础历年真题摘选带答案(5.docx
文档评论(0)