碎纸片的拼接复原-2013年全国大学生数学建模竞赛B题全国一等奖论文.docxVIP

下载本文档

1921
1
约2.17万字
约 38页
2017-05-23 发布于新疆
举报
版权申诉

碎纸片的拼接复原-2013年全国大学生数学建模竞赛B题全国一等奖论文.docx

1、本文档共38页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE \* MERGEFORMAT 36碎纸片的拼接复原【摘要】破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。本文主要解决碎纸机切割后的碎纸片拼接复原问题。针对第一问，附件1、2分别为沿纵向切割后的19张中英文碎纸片，本文在考虑破碎纸片携带信息量较大的基础上，利用MATLAB对附件1、2的碎纸片图像分别读入，以数字矩阵的方式进行存储。利用数字矩阵中包含图像边缘灰度这一特征，本文采用贪心算法的思想，在首先确定原文件左右边界的基础上，以Manhattan距离来度量两两碎纸片边界差异度，利用计算机搜索依次从左往右搜寻最匹配的碎纸片进行横向配对并达成排序目的。最终，本文在没有进行人工干预，成功地将附件1、2碎纸片分别拼接复原，得到复原图片见附录2.1、2.2，纵切中文及英文结果表分别如下:9151316411317256101419128181747381619121621014119131518175针对第二问，附件3、4分别为既横切又纵切后的209张中英文碎纸片，本文核心思想仍为贪心算法，整体思路为先对209张碎纸片进行聚类还原成11行，再对分好的每行进行横向排序，最后对排序好的各行进行纵向排序。本文在充分考虑汉字与拉丁字母结构特征差异以及每块碎纸片携带信息减少的基础上，创新地提出一种特征线模型来分别描述汉字及拉丁文字母的特征用于行聚类。对于行聚类后碎片的横向排序，本文综合了广义Jaccard系数、一阶差分法、二阶差分法、Spearman系数等来构建扩展的边界差异度模型，刻画碎片间的差异度。对于计算机横向排序存在些许错误的情况，本文给出了人工干预的位置节点和方式。对于横向排序后的各行，由于在一页纸上，文字的各行是均匀分布的，本文基于各行文字的特征线，在确定首行的位置后，估计出其他行的基准线位置，得到一页的基准线网格，并通过各行基准线在基准线网格上的适配实现纵向的排序。最终，本文成功的将附件3、4碎纸片分别拼接复原得到复原图片及结果表见附录1.3、1.4、2.3、2.4，同时本文给出了横向排序中人工干预的位置节点和方式。针对第三问，附件5为双面文件既横切又纵切后的209张碎片（包含正反面），即包含418张图像。本文整体解决思路同第二问中对于拉丁文碎片的复原类似，并且由于正反两面的特征可以同时作为差异度判断条件，特征信息丰富，综合使用各种差异度函数后可以将各行全部正确排列，无需人工排错，同时正确排序时自然分出两面。以与问题二类似的方法，确定出每一面的第一行后，用基准线网格确定各行的位置并排序。然而由于附件5原件的第3、第4行及第9、第10行的两个切口正好切到了两行行间的空白，同时两面文字高度一致，所以计算机不可能分辨二者是否在同一面，此处必须由人工介入，通过上下文区分。最终，本文成功的将附件5所有碎片分别拼接复原得到复原图片及结果表见附录1.5、1.6、2.5、2.6。对于本问题，本文只在最后模块的上下文判断和横向排列的方法选择时进行了干预，自动化程度高。本文发现在横向排序中，一、二阶差分法对于样本量大的情况适配成功率很高，而广义Jaccard系数及Spearman系数则对样本量小但特征显著的情况适配的成功率更高。关键词：图像拼接复原贪心算法差异度相似系数文字基准线一、问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上，拼接复原工作需由人工完成，准确率较高，但效率很低。特别是当碎片数量巨大，人工拼接很难在短时间内完成任务。随着计算机技术的发展，人们试图开发碎纸片的自动拼接技术，以提高拼接复原效率。请讨论以下问题：1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达。2. 对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果表达要求同上。3. 上述所给碎片数据均为单面打印文件，从现实情形出发，还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法，并就附件5的碎片数据给出拼接复原结果，结果表达要求同上。二、模型假设1. 假设原题附件给出的破碎纸片图像是完好无损的。2. 假设原题附件给出的破碎纸片仅包含纯文字内容（中英文），不含表格线等。3. 假设原题附件给出的破碎纸片在切割时无油墨损失。4. 假设原题

您可能关注的文档

文档评论（0）

绿风 + 关注: 实名认证

文档贡献者

教师资格证持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2024年11月27日上传了教师资格证

1亿VIP精品文档

更多 >

碎纸片的拼接复原-2013年全国大学生数学建模竞赛B题全国一等奖论文.docxVIP