- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学建模竞赛B题论文-算法与纸片拼接复原模型的建立
算法与纸片拼接复原模型的建立
摘要
传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。
要完成破碎纸片的复原工作,需要对附件1中所给出的信息中找出所有纸片之间的关联。首先,我们要对这些纸片输入MATLAB软件利用imread函数进行初步处理读取19张纸片的数据矩阵。其次,利用纸张页边距这一特点对灰度值进行聚类分析可以选出一张纸片作为第一张基础拼接纸片。最后,通过对前一张纸片矩阵的最右侧的一列数据和其余纸片矩阵最左侧的一列数据求吻合程度的值,通过比较的大小选出方差最小的一张纸片,并将其左侧与前一张纸片右侧拼接完成。以此类推直到最后一张纸片也完成拼接复原工作。最后由人工检验复原的结果,包括文字有无缺失、语句是否通顺等看拼接结果是否正确。
需要找出附件3中所给出的碎纸片之间的关联。首先,将附件3中的纸片图片录入MATLAB软件,利用imread函数进行初步处理读取209张纸片的数据矩阵。其次,利用纸张具有页边距的特点对灰度值进行聚类类分析,找出左侧留白的碎纸片,利用问题一中的方法将所有最左边碎纸片按顺序拼接复原好。接下来,将这一列作为基础拼接列,用基础拼接列的第一张纸片的数据矩阵的最右侧的一列数据和其余纸片矩阵最左侧的一列数据求吻合程度的值,通过比较的大小选出方差最小的一张纸片,并将其左侧与前一张纸片右侧拼接完成。以此类推直到最后一张纸片也完成拼接复原工作。最后,由人工检验复原的结果,包括文字有无缺失、语句是否通顺等看拼接结果是否正确。
随着问题难度的加深,在前两问的基础上问题三不仅有纵向和横向的切割方法还涉及到英文文件的正反两面打印(一种情况是两面文字方向相同,另一种情况是两面的文字方向相反)的情况。一方面,给拼接工作带来了很大的难度,另一方面正反面的粉碎情况可以对最后的拼接结果进一步检验。通过对英语26个字母的书写格式进行分析,将附件5中的418张纸片录入MATLAB软件
关键词:聚类分析,欧氏距离,旅行商
问题重述
随着计算机技术的不断发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。我们需要对以下问题进行讨论:
1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达。
2. 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果表达要求同上。
3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。
问题分析
问题一
本题我们以附件1为例。要完成破碎纸片的复原工作,我们需要对附件1中所给出的一些看似毫无头绪的信息中找出所有纸片之间的关联。由于需要按顺序从已经确定的第一张碎纸片开始依次匹配相邻的碎纸片,不仅需要建立一个循环的算法,考虑到如果是一个汉字被裁开的话,左右笔画的连续性会使得两边像素点的数值基本相似,做可能相邻边缘矩阵的数值差的平方和后会得到一系列数值,理论上最小的数值即为复原过程中相邻的碎纸片,如果循环结果不符合要求,则有可能是出现了左右边缘都为空白的矩阵,还要在此处人工根据文字的特点排出正确的顺序。
首先,我们要对这些纸片输入MATLAB软件利用imread函数进行初步处理读取19张纸片的数据矩阵。其次,利用纸张具有页边距的特点,可以对每个纸片的灰度值进行聚类分析选出一张纸片作为第一张基础拼接纸片。最后,通过对前一张纸片右侧矩阵的一列数据和其余纸片左侧矩阵的一列数据求纸片的吻合程度,通过比较吻合程度值的大小选出值最小的一张纸片,并将其左侧与前一张纸片右侧拼接完成。以此类推直到最后一张纸片也完成拼接复原工作。
在复原工作中我们需要做一些人工干预工作。在读取好纸片矩阵后求算方差之间,我们需要人工选出编号为008的纸片作为基础拼接图片。最后的拼接复原结果还需人工通过对拼接好的内容进行核对,包括文字有无缺失、语句是否通顺等来检验复原结果是否正确。
问题二
类似问题一的求解过程。本题我们以附件3为例。要完成破碎纸片的复原工作,我们需要对附件3中所给出的一些看似无关的信息中找出所有纸片之间的关联。由于需要按顺序从已经确定的纸片拼接基础列,再开
您可能关注的文档
最近下载
- 北京十三中2025-2026学年上学期初二数学期中考试试卷.doc VIP
- 2025-2026学年初中信息技术(信息科技)第4册泰山版(2018)教学设计合集.docx
- 黑龙江总工会招聘考试试题及答案.doc VIP
- 六年级上册数学第四单元《解决问题的策略—假设》教学课件(苏教版).pptx VIP
- 新形态一体化教材建设的探索与实践.docx VIP
- 人教版二年级数学上册期中学业质量测评卷 (范围:第一单元至第三单元) (含答案).docx VIP
- 中班科学活动动物的家讲课.pptx VIP
- 生产部绩效考核表经典.doc VIP
- 99(03)S203消防水泵接合器安装(2003年局部修改版).pdf VIP
- 2025年高考模考作文:凡事预则立,不预则废.docx VIP
原创力文档


文档评论(0)