2013建B题.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2013建B题

碎纸片的拼接复原 摘要 本文围绕的是碎纸片的拼接复原问题,对打印碎纸片的单面纵切、横纵切,到双面的横纵切,纸面内容分纯汉字、纯英文两种方式,分别建立了拼接复原的模型,得出了复原的图片。 针对问题一,对于纵切碎纸片的拼接,我们建立了“列向量匹配最优”模型,通过把图片进行灰度化处理,得到灰度共生矩阵,在用二值法将矩阵转化为0-1矩阵。每一个0-1矩阵的前后两列表示每张图片的左右两边,先找出原图最左侧图片的右边作为固定的列向量,通过计算列向量之间的相关系数,从而找出与其匹配的右侧向量,即得到与其拼接的右侧图片,依此类推,得到中文碎片排列序列:(008,014,012,015,003,010,002,016,001,004,005,009,013,018,011,007,017,000, 006)英文碎片排列序列:(003006,002,007,015,018,011,000,005,001,009,013,010 008,012,014,017,016,004) 针对问题二,对于既纵切又横切纸片的拼接,我们基于问题一模型建立的基础上,又建立了“行特征向量聚类分析”模型,对所有碎片计算行特征值向量,然后据行特征值向量进行归类,对每类中的碎片按照问题一方法的处理,得到几块横向拼接完整的图片及游离碎片,然后对拼接碎片进行纵向拼接,并对游离碎片进行二次拼接,则可得到中、英文碎片纵向拼接的原图。 针对问题三,,对于正反两面都有内容的既横切又纵切的纸片的拼接,我们给出了基于问题一、二模型的“多步列向量匹配最优”模型,首先找到位于原图左端的图块,再横向匹配出列宽与原图相等的矩阵,最后将得到的所有矩阵进行纵向匹配,优先拼接出原图的其中一面,就可以写出另一面的复原代码。 关键词:灰度 行特征向量 列向量匹配最优 聚类分析 一、问题重述 破碎文件的拼接在司法物证复原、历史文献修复以及军事情报等领域都有着重要的应用。传统上,拼接复原工作需有人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。请讨论以下问题: 1.对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果以图片的形式及表格形式表达。(见【结果表达格式说明】)。 2.对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人·工干预,请写出干预方式及干预的时间节点。复原结果表达式要求同上。 3.上述所给碎片数据为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达式要求同上。 二、问题分析 对于碎纸机破碎出来的碎纸片是规则的四边形,而不是手撕的无规则图形,那么我们就避免了运用撕片边缘的几何特征、形状的方法进行拼接,而是基于边缘文字特征,利用像素灰度化的方法寻求两张碎片间的相似关系,从而拼接处完整的图片。 对于问题一,要对碎纸片的纵片的拼接,由于纸片都是规则的,所以通过文字的灰度化,从而构建0-1化矩阵,对左右临边的列向量进行比较匹配,通过计算依次得出相关系数最大的两列矩阵,得出匹配结果。 对于问题二,要对横、纵切的纸片进行拼接,它不同于问题问题一,所涉及的图片更多,数据量更大,如果采用上述方法就要对任意列向量同其他208个向量比较匹配,且精确度不高,我们则先通过对所有图品分类,在对各类进行拼接匹配,形成匹配好的分块图片,再将分块的图片通过人工干预的方式匹配得到原图。 对于问题三,对于正反两面横纵切割的纸片,我们同时分析209张碎纸片的418面图片,采用找出位于原图左端的矩阵,通过列向量最优匹配模型进行合并来找出22个能表示原图中完整一行的矩阵。之后,我们从22个矩阵中任选一个进行列匹配,最终拼接出一个大小等同于原图的矩阵。因为图片编号正反两边相对应,我们只需要求出原图的一面,就可以推出另一面的复原序号,得出问题结果。 三、模型假设 针对问题的描述,为了模型建立及问题计算的方便,对问题进行了简化处理,我们进行了下列定义: 原纸片是规则的,且都为长方形; 所有的碎纸片也是规则的四边形; 碎片中无表格、图像,仅有汉字、字母,且仅有黑白两种颜色; 中文碎片为纯中文字符组成,清晰明了,无明显噪音影响; 英文碎片为纯英文字符组成,无明显噪音影响; 四、符号说明 符号 符号解释

文档评论(0)

wt60063 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档