碎纸片的拼接复原分析模型.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
碎纸片拼接复原的设计与实现 摘要 破碎文件的拼接在司法物证复原、历史文献修复获取等领域都有重要的应用。最小的原则,可计算出下一张图片。重复此步骤,以此类推,每次都挑选出剩余图片中与前一幅图片吻合参数最小的作为与之相连接的碎纸图片。最后可得到 附件1的答案矩阵为: 008 014 012 015 003 010 002 016 001 004 005 009 013 018 011 007 017 000 006 附件2与附件1的模型求解方法相同,最后得到: 附件2的答案矩阵为: 003 006 002 007 015 018 011 000 005 001 009 013 010 008 012 014 017 016 004 (二)由于每片独立的拼接无法达到最佳效果。故我们以缩小比对范围的形式来进行优化。附件3类比于问题一,用相同的方法找到所有碎纸片的左边界,共11张,分别 049 061 168 038 071 014 094 125 029 007 089 根据行特征筛选出每行的碎纸图片以保证全部图片均得到分类。此时选取数量最少一行作为入手点,利用MATLAB软件进行图片拼接。但由于碎纸图片的行特征值有误差,故图片大块拼接正确,但与实际情况有细微差别。通过简单的人工检测得到准确行的排列顺序,由于行信息充足,借用第一问最终达到正确拼接效果。结果矩阵如 表12 所示。 第二种情况的关键点是找出准确的行特征,由于汉字与英文书写格式不同,汉字均为方块字,易于定位。而英文由于特殊的书写方式,上下位置不同,不易于找到行特征值。如:英文字母最为密集行中点位置。需将附件4图片对应的矩阵转化为0-1列向量(空白行为0,反之则为1)。利用此方法筛选出位于同一行的碎纸片并进行纸片拼接。后续拼接方法同附件3。结果矩阵如 表13 所示。 (三)结合双面信息处理边界,得到边界特点。根据元音字母中心位置得出行高,从而更准确筛选同行图片。双面信息同时校准,更容易得到拼接顺序,人工干预少。结果矩阵如 表5 所示。 模型一简单易处理,适用于含大量信息的碎纸片拼接且准确度高;模型二针对文字内容的中英文差异分别利用吻合参数和行高作为标准来筛选图片;模型三深入生活实际,考虑日常生活中反正面印刷情况并结合英文印刷特点,实用性高,双面信息同时校准,人工干预少。 关键字:碎纸拼接 MATLAB 吻合参数 灰度 一、问题重述 破碎文件的拼接在司法物证复原、历史文献修复获取等领域都有重要的应用。传统上,复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸的自动拼接技术,以提高拼接效率。对于给定的来自同一页的片(仅纵切),建立碎纸拼接算法,并针对附件1给出的数据进行复原对于碎纸机纵切横切的情形,模型和算法,并针对附件给出的数据进行复原。从现实出发,模型与算法数据文件说明 每一附件为同一页纸的碎片数据。 附件1、附件2为纵切碎片数据,每页纸被切为19条碎片。该附件中每一碎片对应两个文件,共有2个文件例如,碎片两面分别000a、000b11×19的表格; 不能确定复原位置的碎片,可不填入上述表格,单独列表。 二、模型假设 每张碎纸片的形状都是完全相同的长方形且每张碎纸片形状规则; 文字打印清晰,无缺墨断墨情况; 纸片边缘整齐,无重叠,无损耗; 扫描过程中每张碎纸片的位置都是完全平行的,不会出现倾斜的情况; 假设恰好能完全拼接,即碎片无缺失,也没有其他碎片混杂; 纸片无倒转; 碎片文字均为相同字号,字号大小适中; 文字印刷体行高、行间距相同; 页边距非0,但较小。 三、字符说明 1、表示第张图片所转化得到的矩阵; 2、表示第个图所形成的矩阵的第行列对应灰度值; 3、表示第个图所形成的矩阵的第列; 4、表示第个图和第个图之间的吻合参数(其含义在模型分析中说明),其中两张图的吻合参数越低表示这两张图越吻合; 5、表示图的0-1列向量 四、模型分析 本文针对三种碎片拼接类型分别建立数学模型。 模型一简单易处理,适用于单片含大量信息的碎纸片拼接且准确度高; 模型二针对文字内容的中英文差异分别利用吻合参数和行高作为标准来筛选图片,且以缩小比对范围的形式应用于庞大数据量的整理进而进行碎片拼接复原; 模型三深入生活实际,考虑日常生活中反正面印刷情况并结合英文印刷特点,实用性高,准确度大。 问题一: 利用MATLAB程序中的imread函数将附件1的19张碎纸片分别转化成矩阵形式,每一张碎纸片都可转化为一个的矩阵。for循环的使用可以很大程度上节省时间、人力,再根据边界准则通过计算首列数字变化来确定其边界。最后根据吻合参数的大小确定最后的碎纸片拼接顺序。 求解步骤如下: (图1:问题

文档评论(0)

lyxbb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档