碎纸片的拼接复原_数学建模二等奖论文.doc

碎纸片的拼接复原_数学建模二等奖论文.doc

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE PAGE 40 碎纸片的拼接复原 摘要 破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。但是人工完成效率很低,所以引入计算机复原,计算机虽然准确率不及人工高,但是可以大大减轻工作强度。本论文主要是对纸张形状为矩形切割规范并且纸张上的文字标准的碎纸片的拼接复原的研究。 问题一:首先根据图片的灰度矩阵找出第一张(最左侧)图片,根据小差值优先匹配依次排出相邻图片。碎纸片复原后的顺序如附件一、二所示。 问题二:首先根据图片的灰度矩阵最左侧n列灰度值求和最大,可找出第一列(最左侧)图片,共11张。根据 “行间”的位置特征作为凝聚点进行聚类分析,将所有图片分为11类,即11行。应用小差值优先匹配将这每行的图片进行拼接,得到11个行图片,再次应用小差值优先匹配把这11个行图片拼接成完整的图片。碎纸片复原后的顺序如附件三、四所示。 问题三:同问题二方法一致,找出第一列(最左侧)图片(正反两面共有22张图片),将这些“行间”的位置特征作为凝聚点进行聚类分析,所有的图片分为11“大行”,将这些图片配对的正反面进行上边缘“粘接”处理,按照小差值优先匹配将这每行的粘接形成的19图片(如图一所示)进行拼接,得到11个行图片之后,再次应用小差值优先匹配把这11个行图片拼接成完整的图片。碎纸片复原后的顺序如附件五所示。 观察上述三个问题的处理方法可知,三个问题的解决办法主干思想完全相同,都是小差值优先匹配解决,并且清晰简练。但是由于问题的逐渐深入和复杂程度的增加,仅靠这一个简单的方法并不能在实际中解决问题,于是增加约束条件减小搜索范围,如:找出“行间”位置,并作为凝聚点进行聚类分析,然后就可以很大程度上减小出错的概率。 关键词:聚类分析、MATLAB R2012a、小差值优先匹配、灰度矩阵 1、问题重述 破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。请讨论以下问题: (1). 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达(见【结果表达格式说明】)。 (2). 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果表达要求同上。 (3). 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。 2、问题分析 分析本问题可知,第一问是解决此类问题的基本方法,第二问及第三问相比第一问逐渐变得复杂,但主要解决思路与第一问相同,只是在第一问的基础上需要应用其他方法缩小搜索范围,但主体方法并未改变。 针对问题一:对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法。在MATLAB软件[1][2]中应用imread函数读取附件一及附件二中的图片,可以获得相应的灰度矩阵,从矩阵中可以清楚地看到图片中每个像素的灰度值。观察图片边缘及灰度矩阵边缘可以得出:图片被切割后会在这张图片被切割两侧生成相似的两个列矩阵,可以猜测这两个列矩阵相似程度越高则这两张图片可以拼接复原的概率就越大。为表示两列矩阵的相似程度,对这两列矩阵进行对应行相减取绝对值最后求和,所求得的和越小两矩阵越相似即复原概率越大。最左边一张图片的最左侧全为空白,即最左侧矩阵所有行求和值最大,可以得到最左侧的图片,然后可以拼接出整张图片。 针对问题二:对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法。 方法一:应用第一问中的小差值优先匹配,求出所有图片边缘矩阵的对应行相减取绝对值最后求和,然后逐个比较,此时会发现由于图片小且图片中字数较少,灰度矩阵所给出的信息就会比较少,并且应用小差值优先匹配所求和会有大量数值相差不是很大图片出现,出现过多的候选项,这会对判断哪张图片可以复原产生很大的影响,甚至会出现无法选择,因为部分图片是正好没有切割文字,此时计算机是无法判断哪张可以复原的,就需要对方法一进行补充提供更多的约束条件或是进行人工干预,所以得出了以下的方法二。 方法二:

您可能关注的文档

文档评论(0)

rovend + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档