CUMCM2013-碎纸片的拼接复原(全国一等奖).pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CUMCM2013-碎纸片的拼接复原(全国一等奖).pdf

碎纸片的拼接复原 ( 张旭萌(数学与应用数学) 、崔宇 数学与应用数学) 、顾尔健 (计算机科学与技术) (全国一等奖) 摘要 本文针对碎纸片拼接问题不同的规模和难度,制定了贪心策略,模拟退火,合成启 发式等多样的算法策略,并利用分类思想,化繁为简,大大增加了算法效率;同时本文 兼顾到问题求解的时间、人工干预时机和 “距离”函数的选择,并人性化的开发了具有 实用功能的计算机软件,并以此对问题进行拓展。 首先,我们类比经典的 TSP 问题的数学模型建立过程,删除 “返回起始点”的限制 条件,并利用 0-1 规划思想建立了简洁的模型。在距离函数的选择上,本文以 “实用性” 为原则,舍弃了贝叶斯分类器等复杂的函数,而选择了实验效果较好的绝对值距离和欧 氏距离,同时利用统计最优解和次优解的区分度对这两种距离函数做出了评价。 对于问题一,在该模型的基础之上,利用贪心策略即可直接搜索出最基本问题的排 列顺序。 对于问题二这样规模更大,更复杂的情况,本文采用了分类思想,利用碎片的行特 征,如行高,文字相对坐标等,将其划分到各个行,形成若干个子问题分别求解,最后 再将解得的行进行合并。对于中文 片,本文巧妙的提取碎片文字中心,从而确定出一 个中心位置,以此为标准进行划分,无需人工干预就将所有碎片划分到了 11 个行。之 后,利用模拟退火算法对每一个行的排列进行求解优化,最后人为进行结果的调整。而 英文碎片的特征信息相对更少,考虑到英文字母的特点,本文利用灰度值密度确定碎片 特征位置坐标,并以此作为划分的依据;由于英文碎片在行相对坐标上有重叠,并没有 像中文纸片那样被直接划分成 11 个行,我们放弃了模拟退火算法,以局部优化的方式, 代替了全局优化,采用更灵活的合成启发式算法,对每一次成功的拼接的碎片进行保留, 同时记录失败的拼接,防止重复搜索,并设置函数判别阀值,在合适的时机由人去判别 是否拼接,拼接效率较好。 对于问题三中双面有字的碎片,求解问题二的方法也同样适用。本文额外设计了一 种关联算法,在碎片一面拼接时同时将背面拼接好,减少了拼接次数。 在此之外,我们额外对纸片的识别,如中英文纸片的区分,两张混杂在一起的纸片 拼接,模式匹配等方面进行了拓展研究,并制作了简单易用的软件,使得人工干预更为 方便,模型的实用性更强。 本文的特色在于人性化的考虑,在成功解决问题的基础之上,利用合理的分类,高 效的优化算法,大大降低了人为干预的次数,而在不得不介入人为干预的情况下,又设 计出友好的程序软件,方便了人们的使用。 关键词: 灰度矩阵 TSP 问题 相似性测度 模拟退火算法 合成启发式算法 1 一.问题重述与分析 破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重 要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当 碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图 开发碎纸片的自动拼接技术,以提高拼接复原效率。 1.1 问题一的重述与分析 问题一中所给出的文字图片文件仅是通过对原文件纵切形成的,要求通过建立碎纸 片拼接复原模型和算法对所有图片进行排序恢复原文件。碎纸片的边缘信息可以反映该 图片的特征,因此我们首先可以提取出图片的边缘信息,由于文件仅纵切,边缘处所保 留的信息较多,

文档评论(0)

zhoubingchina + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档