数学建模2013全国大学生.docVIP

下载本文档

4
0
约8.81千字
约 22页
2016-05-14 发布于重庆
举报
版权申诉

数学建模2013全国大学生.doc

1、本文档共22页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数学建模2013全国大学生

2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛赛区评阅编号（由赛区组委会评阅前进行编号）： 2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：赛区评阅记录（可供赛区评阅时使用）：评阅人评分备注全国统一编号（由赛区组委会送交全国前编号）：全国评阅编号（由全国组委会评阅前进行编号）：碎纸片的拼接与复原模型分析摘要本文研究的是碎纸片的拼接与复原问题。利用碎纸片内字迹的连续性和行间距等特征，对纸片边缘进行相似度分析，以碎纸片边缘文字的灰度为依据进行匹配与拼接。在此基础上,加上人工干预,采用半自动碎片拼接的方法,对碎纸片进一步进行比较与分析。针对问题一，我们首先利用Matlab将图片进行数字化处理，得出大量表示某点灰度的数据。再提取边缘数据，得到两列数据分别表示碎纸片左右边缘的灰度情况。用这两列数据组成两个列向量，代表一个碎纸片。由于碎纸片拼接完成后左边是全部白色，即灰度为最大值，因此可以先找出这个碎纸片，再进行其他的拼接工作。将一个碎纸片右边的向量与剩下的所有碎纸片左边的向量逐一进行匹配，最相似的既可以进行拼接。也就是说以两个向量对应元素之差的绝对值之和为标准，和最小,两向量最相似，两碎纸片最为匹配。针对问题二，先将每个碎片进行与问题一中一样的数字化处理,并对每个碎片进行左右边缘数据提取。利用纸张左侧页边距的空白，我们先筛选出页面最左边的碎纸片，并以此为起点按照最相似的原则向右拼接碎纸片。与问题一不同的是，由于本问题涉及纸片较多，出错的概率大大加增加。为此，我们采用机器筛选与人工识别相结合的办法。机器筛选出碎片后再由人工判断是否正确，确保得到可靠结果。当碎纸片最右侧为空白时，因无法进行简单的人工识别，即中止该行向右匹配。当所有橫行匹配完毕，未匹配的碎纸片个数已经大大减少，此时再根据句意和文字行分布情况，继续用机器筛选与人工识别相结合的方法进一步匹配。最后得到完整的整行碎片，即仅存在横切的碎纸片。再按问题一方法进行拼接。针对问题三，碎纸片正反面都有信息，由于文字的格式是一样的，因此分辨不出碎纸片的正反面.但我们同时得到了这样的一个条件，即一个碎纸片的左端与另一碎纸片的右端匹配时，那么该碎纸片背面的右端必定与另一碎纸片背面的左端相匹配的。以此为约束条件，进行编程计算，是问题三的关键所在。与问题二相比，问题三中图片的信息量是其两倍，但总的思路还是相似的。在筛选出处于文件边端的碎纸片后，依次以它们为基础进行拼接，得到横行后，再进行文件上下的拼接。必要的人工干预在机器无法给出正确拼接顺序是进行。关键词：文件拼接半自动机器筛选人工识别一问题重述 1.1问题背景破碎文件的拼接与复原，在众多领域有着很重要的应用，如司法物证复原、历史文献修复以及军事情报获取。一般的纸质文件的拼接需要人工完成，耗费大量的时间，效率低下。当需要在短时间内完成重要文件的拼接工作时，人工复原的方法就无可取之处。因此，人们开始寻找利用计算机进行碎纸片自动拼接的技术，以提高拼接复原效率。 1.2问题提出该题给了我们5个附件，为五份文件的碎纸片图片。需要我们通过模型建立，达到拼接的效果。该题给出了三个问题，由易入难，需要我们建立模型，解决一下问题： 1.对来自同一文件的破碎纸片（仅纵切），建立拼接复原模型和算法，并针对给出的数据进行复原，并针给出的数据进行复原。进行复原：碎纸片边缘数据组成的三维数组，表示第个碎纸片左或右边缘第行的数据。：碎纸片边缘数据组成四维数组，表示第个碎纸片片左或右边缘第行或面的数据。：表示碎纸片的编号，即第个碎纸片。：只有两个值，和，表示碎纸片的左边缘数据，表示碎纸片的右边缘数据。：表示数据所在的的行数。：只有两个值，和，表示碎纸片的面，表示碎纸片的面。：表示两数组间的距离。三维数组中，四维数组中四模型的建立与求解 4.1问题一的分析碎纸片所包含的信息量巨大，数字化处理后，每一个碎纸片都由一个的向量表示。若是对每一个数据都进行分析，不仅效率低而且没有必要，因为碎纸片的拼接过程中只需要对边缘进行分析，中间的信息对拼接的影响并不是很大。因此借助Matlab对碎纸片边缘数据进行提取，得到左右两边的数据（第一问中不需要进行上下拼接，因此只提取左右的数据信息即可），即两个分别表示左右边缘信息的的向量，用数组表示。将第一个碎纸片的最右边数据与其他