2013建B题.docVIP

下载本文档

7
0
约11.76万字
约 30页
2016-12-08 发布于河南
举报
版权申诉

2013建B题.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2013建B题

碎纸片的拼接复原摘要本文围绕的是碎纸片的拼接复原问题，对打印碎纸片的单面纵切、横纵切，到双面的横纵切，纸面内容分纯汉字、纯英文两种方式，分别建立了拼接复原的模型，得出了复原的图片。针对问题一，对于纵切碎纸片的拼接，我们建立了“列向量匹配最优”模型，通过把图片进行灰度化处理，得到灰度共生矩阵，在用二值法将矩阵转化为0-1矩阵。每一个0-1矩阵的前后两列表示每张图片的左右两边，先找出原图最左侧图片的右边作为固定的列向量，通过计算列向量之间的相关系数，从而找出与其匹配的右侧向量，即得到与其拼接的右侧图片，依此类推，得到中文碎片排列序列：（008,014,012,015,003,010,002,016,001,004,005,009,013,018,011,007,017,000, 006）英文碎片排列序列：（003006,002,007,015,018,011,000,005,001,009,013,010 008,012,014,017,016,004）针对问题二，对于既纵切又横切纸片的拼接，我们基于问题一模型建立的基础上，又建立了“行特征向量聚类分析”模型，对所有碎片计算行特征值向量，然后据行特征值向量进行归类，对每类中的碎片按照问题一方法的处理，得到几块横向拼接完整的图片及游离碎片，然后对拼接碎片进行纵向拼接，并对游离碎片进行二次拼接，则可得到中、英文碎片纵向拼接的原图。针对问题三，，对于正反两面都有内容的既横切又纵切的纸片的拼接，我们给出了基于问题一、二模型的“多步列向量匹配最优”模型，首先找到位于原图左端的图块，再横向匹配出列宽与原图相等的矩阵，最后将得到的所有矩阵进行纵向匹配，优先拼接出原图的其中一面，就可以写出另一面的复原代码。关键词：灰度行特征向量列向量匹配最优聚类分析一、问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报等领域都有着重要的应用。传统上，拼接复原工作需有人工完成，准确率较高，但效率很低。特别是当碎片数量巨大，人工拼接很难在短时间内完成任务。随着计算机的发展，人们试图开发碎纸片的自动拼接技术，以提高拼接复原效率。请讨论以下问题： 1.对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果以图片的形式及表格形式表达。(见【结果表达格式说明】)。 2.对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人·工干预，请写出干预方式及干预的时间节点。复原结果表达式要求同上。 3.上述所给碎片数据为单面打印文件，从现实情形出发，还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法，并就附件5的碎片数据给出拼接复原结果，结果表达式要求同上。二、问题分析对于碎纸机破碎出来的碎纸片是规则的四边形，而不是手撕的无规则图形，那么我们就避免了运用撕片边缘的几何特征、形状的方法进行拼接，而是基于边缘文字特征，利用像素灰度化的方法寻求两张碎片间的相似关系，从而拼接处完整的图片。对于问题一，要对碎纸片的纵片的拼接，由于纸片都是规则的，所以通过文字的灰度化，从而构建0-1化矩阵，对左右临边的列向量进行比较匹配，通过计算依次得出相关系数最大的两列矩阵，得出匹配结果。对于问题二，要对横、纵切的纸片进行拼接，它不同于问题问题一，所涉及的图片更多，数据量更大，如果采用上述方法就要对任意列向量同其他208个向量比较匹配，且精确度不高，我们则先通过对所有图品分类，在对各类进行拼接匹配，形成匹配好的分块图片，再将分块的图片通过人工干预的方式匹配得到原图。对于问题三，对于正反两面横纵切割的纸片，我们同时分析209张碎纸片的418面图片，采用找出位于原图左端的矩阵，通过列向量最优匹配模型进行合并来找出22个能表示原图中完整一行的矩阵。之后，我们从22个矩阵中任选一个进行列匹配，最终拼接出一个大小等同于原图的矩阵。因为图片编号正反两边相对应，我们只需要求出原图的一面，就可以推出另一面的复原序号，得出问题结果。三、模型假设针对问题的描述，为了模型建立及问题计算的方便，对问题进行了简化处理，我们进行了下列定义：原纸片是规则的，且都为长方形；所有的碎纸片也是规则的四边形；碎片中无表格、图像，仅有汉字、字母，且仅有黑白两种颜色；中文碎片为纯中文字符组成，清晰明了，无明显噪音影响；英文碎片为纯英文字符组成，无明显噪音影响；四、符号说明符号符号解释