碎纸片还原问题求解摘要.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。碎纸片自动拼接复原技术现今可以归结到计算机视觉和模式识别领域内的问题。 问题的重述:     首先,对于给定的来自同一页单面印刷文字文件的碎纸机破碎中、英文纸片(仅纵切),建立碎纸片拼接复原模型和算法;   其次,在第一问的基础上设计出单面印刷文件既纵切又横切的碎纸片拼接复原模型和算法;    最后,对还有可能出现双面打印文件的既横切又纵切的碎纸片设计出相应的拼接复原模型与算法。 1、 同一附件中的碎纸片来自于同一页文件,且未缺失; 2、文章中同一行汉子均在同一条水平线上,没有倾斜,且字纵向上长度相同(“一”除外),英文字母大小在三条间距相同的横线间,且均占满所在的间隔。 3、 碎纸片表面光滑平整无磨损且无污点; 4、 假设破碎纸片边缘完好无缺损。 碎纸片经matlab数字化得到1980x72的矩阵,矩阵中的值就是像素,取值在0-1,如图所示 其中M=1980,N=1368. 当k=72i-71与k=72i分别对应于第张纸片数字化后所对应矩阵的第一列与最后一列。 令 为第 i 张纸片的最后一列与第 s 张纸片第一列第行数据的平方欧氏距离,该值为 问题一:被纵切后碎纸片的拼接复原模型的求解 为了寻找已经确定好位置的第张碎纸片最相匹配的碎纸片,要求确定好位置的第 i 张碎纸片最后一列与其拼接碎纸片的第一列平方欧氏距离总和最小,数学表达式如下: 借助了贪婪算法的思想。现根据目标函数作最优选择,每做一次贪心选择就将未实现拼接的碎纸片集合。为未匹配碎纸片的集合。集合中碎纸片数量为:n=19-i 。 碎纸片经matlab数字化得到1980x72的矩阵,矩阵中的值就是像素,取值在0-1,如图所示 其中M=1980,N=1368. 当k=72i-71与k=72i分别对应于第张纸片数字化后所对应矩阵的第一列与最后一列。 令 为第 i 张纸片的最后一列与第 s 张纸片第一列第行数据的平方欧氏距离,该值为 为了寻找已经确定好位置的第张碎纸片最相匹配的碎纸片,要求确定好位置的第 i 张碎纸片最后一列与其拼接碎纸片的第一列平方欧氏距离总和最小,数学表达式如下: 借助了贪婪算法的思想。现根据目标函数作最优选择,每做一次贪心选择就将未实现拼接的碎纸片集合。为未匹配碎纸片的集合。集合中碎纸片数量为:n=11-i 。 基于最小二乘法和分治算法的 碎纸片拼接复原 成员:沈旭东 张郁哲 吴鹏 中国石油大学(华东) 引言: 引言: 问题的分析: 对于碎纸片的拼接问题的解决,我首先想到的是可不可以考虑笔画连续性问题来进行求解,然后我就想到了关于运用函数连续性的证明? 但是发现这好像行不通,然后查阅资料知道将照片数字化处理后得到灰度,用0表示黑色,1表示白色,可以考虑运用最小二乘法来进行匹配程度的表达。然后根据贪婪算法思想,每一步都取最优,对于可能会出现的不匹配情况结合人工干预进行调整。 模型的假设及符号说明 : 符号说明 模型准备: 模型准备: 拼接流程 问题二:被横、纵切后碎纸片的拼接复原模型的建立 (一) 碎纸片的层次聚类 问题二:被横、纵切后碎纸片的拼接复原模型的建立 (一) 碎纸片的层次聚类 一幅黑白照片,它在水平与垂直方向上的亮度变化是连续的,在经过数字化后,即表现为它所对应矩阵的灰度值取值是连续的。进而可以了解到,若两张碎纸片位于复原文件中同几行时,那么其对应矩阵灰度值在纵向上分布近似。经观察测试,原始文档碎片具有下列特点: (1)字体大小:字体的最大高度和最大宽度一致。 (2)切割的均匀性:同方向的切割线平行,图片大小均相等,沿纵横方向按直线切割。 (3)文字的行距:文字的行间距等同,段落间距为定值。因此可以通过此特点先将图片进行数字化处理放入.xls文件中然后

文档评论(0)

三哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档