- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
碎纸片的拼接复原摘 要随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。本文运用欧氏距离、相关性分析、聚类等方法研究单页打印纵切纸片、单页打印横、纵切纸片以及双页打印横纵切纸片的拼接与复原问题。针对问题一,首先利用MATLAB软件将19个碎片图像转化为灰度值,再将灰度值二值化为0-1矩阵。选择左侧全为空白的碎片作为第一列。其次,根据TSP问题建立基于欧氏距离规则的碎纸片拼接复原模型,通过MATLAB软件筛选最短欧氏距离的碎片编号最终确定拼接的顺序。针对问题二,对于单面横纵切的情形,首先,同问题一的做法类似,通过将碎纸片像素转化的灰度值人工干预筛选出11个左侧为空白的碎纸片作为文件第1列。其次,将纸片灰度值矩阵转化为0-1矩阵,将筛选出的11张碎纸片为分类指标分别建立聚类模型,通过MATLAB软件计算209张碎纸片0-1矩阵的相关系数矩阵并筛选出对应每类相关系数较高的其他18个元素,即得到每类中对应的19张碎纸片。再利用问题一中所建模型,确定每类中纵切碎纸片的正确排序,得到11张横向的复原纸片,同理,通过计算欧氏距离也能得到11个横向纸片的拼接顺序,最终得到一个拼接的整体。针对问题三,首先根据问题一的做法,选择左侧全为空白的22个碎片作为第一列,其次视22张碎纸片为22个类别,并以每类中第一列的碎纸片为起始点,利用问题一中建立的基于欧氏距离原则的碎纸片还原模型求解纸片间的最短距离,从而确定每一类的拼接顺序。最后将拼接好的22张横条根据TSP模型再次拼接复原,拼接好前11个横条即可得到所求结果。关键词:碎片还原;TSP问题;欧氏距离; 相关性分析;聚类模型 问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。请讨论以下问题:1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达(见【结果表达格式说明】)。2. 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果表达要求同上。3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。2. 模型假设原图最左侧边界部分为空白无字符区域;原图最右侧边界部分为空白无字符区域;对原图有字符内容区域进行纵切被分开的两个碎纸片对象的切口边界部分存在破碎字符;3. 通用符号说明序号符号符号说明1列向量到之间的欧氏距离2第个碎片0-1矩阵第j列第t行元素3第个碎片0-1矩阵第j列第t行元素4个碎片左边界的0-1矩阵5个碎片右边界的0-1矩阵6排序后的个碎片的0-1矩阵7边界列向量的欧氏距离矩阵8所有碎纸片二值化后的180209的矩阵9中各列向量的相关系数矩阵10矩阵0-1化的标准阈值11张左边为空的碎纸片12张右边为空的碎纸片4. 问题一:模型的建立、求解及评价4.1问题分析对于问题一,首先对碎片进行灰度化处理,为简化计算,利用MATLAB软件将碎片二值化[1]。其次,考虑到碎纸片都来源于同一单面文件,而文字的笔画大多是连续的,由此可知相邻碎片具有较强的相关性,即碎片二值矩阵的左右边缘是近似相等的。因此,可以通过计算各个碎片的二值矩阵边缘列向量相互之间的欧氏距离,确定碎片的拼接顺序。即将问题一转化为旅行商问题,将各张碎纸片视为个点,各个碎片的二值矩阵边缘列向量相互之间的欧氏距离视为两点间的距离,因此求得碎片的拼接顺序即可视为求通过所有点的最短距离即旅行商问题。4.2模型准备1. 首先用MATLAB软件逐一读取碎纸片,得到19个像素矩阵,其中0像素代表黑色,255像素代表白色。2.用MATLAB中的im2bw函数将像素矩阵转换为0-1矩阵。提取某张碎片左边界像素矩阵的其中20行的数据,如下:[255 157 0 0 0 142 255 255 255 255 255 255 255 255 255 255 255 255 255 255]转换为0-1矩阵为:[1 1 0 0 0 1 1 1 1 1 1 1 1 1 1
文档评论(0)