- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2013B碎纸拼接问题(转)
基于旅行商规划模型的碎纸片拼接复原问题研究
摘要
本文分别针对RSSTD(Reconstruction of Strip Shredded Text Document )、
RCCSTD(Reconstruction of cross-cut Shredded Text Document)和Two-Sides
RCCSTD 三种类型的碎纸片拼接复原问题进行了建模与求解算法设计。首先我
们对于RSSTD 问题,建立了基于二值匹配度的TSP 模型,并将其转化为线性规
划模型,利用贪心策略复原了该问题的中文和英文碎片;然后对于RCCSTD 问
题,由于中英文字的差别,我们分别建立了基于改进误差评估的汉字拼接模型和
基于文字基线的误差评估的英文字拼接模型,并利用误差评估匹配算法,复原了
该问题的中文和英文碎片;随后我们针对正反两面的RCCSTD 问题,利用基线
的概念将正反两面分行,转化为RCCSTD 问题,并复原了该问题的英文碎片。
最后,我们对模型的算法和结果进行了检验和分析。
◎问题一:我们针对仅纵切的情况,首先将图像进行数字化处理,转换为了
二值图像,然后得到各图像的边缘,并计算所有碎片与其他碎片边缘的匹配程度。
然后,根据两两碎片之间的匹配程度建立了TSP 模型,并将其划归为线性规划
模型。最终,我们根据左边距的信息确定了左边第一碎片,随后设计了基于匹配
度的贪心算法从左向右得到了所有碎片的拼接复原结果。结果表明我们的方法对
于中英文两种情况适用性均较好,且该过程不需要人工干预。
◎问题二:我们针对既纵切又横切的情况,由于中英文的差异性,我们在进
行分行聚类时应采用不同的标准。首先根据左右边距的信息确定了左边和右边的
碎片,随后分别利用基于改进误差评估的汉字拼接模型和基于文字基线的误差评
估模型,将剩余的碎片进行分行聚类,然后再利用基于误差评估的行内匹配算法
对行内进行了拼接,最终利用行间匹配算法对行间的碎片进行了再拼接,最终得
到了拼接复原结果。对于拼接过程中可能出现误判的情况,我们利用GUI 编写
了人机交互的人工干预界面,用人的直觉判断提高匹配的成功率和完整性。
◎问题三:我们针对正反两面的情况,首先根据正反基线信息,分别确定了
左右两边的碎片,然后利用基线差值将其两两聚类,聚类以后其正反方向也一并
确定,随后我们将其与剩余碎片进行分行聚类,最终又利用行内匹配和行间匹配
算法得到了最终拼接复原结果。其中,对于可能出现的误判情况,我们同样在匹
配算法中使用了基于GUI 的人机交互干预方式,利用人的直觉提高了结果的可
靠性和完整性。
关键字:碎片复原、TSP 、误差评估匹配、基线误差、人工干预
1
一、问题重述
破碎文件的拼接复原工作在传统上主要需由人工完成,准确率较高,但效率
很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机
技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。请讨
论以下问题:
1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立
碎纸片拼接复原模型和算法,并针对附件1、附件2 给出的中、英文各一页文件
的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预
的时间节点。复原结果以图片形式及表格形式表达。
2. 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,
并针对附件3、附件4 给出的中、英文各一页文件的碎片数据进行拼接复原。如
果复原过程需要人工干预,请写出干预方式及干预的时间节点。
3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面
打印文件的碎纸片拼接复原问题需要解决。请尝试设计相应的碎纸片拼接复原模
型与算法,并就附件5 的碎片数据给出拼接复原结果。
二、问题分析
破碎文件的拼接复原工作,传统人工处理准确率高,但是效率低。随着计算
机技术的发展,本问题试图寻找碎纸片的自动拼接方法。本文的碎片均为矩形,
且大小一样,这就给碎片的拼接带来了困难,因为难以利用碎片的轮廓信息,从
而只能利用碎片边缘的图像像素信息来进行拼接。
对于问题一,给出了纵切的 19 条碎纸片,碎片为1980*72,总切线的像素
点较多
您可能关注的文档
最近下载
- NB∕T 47010-2017 承压设备用不锈钢和耐热钢锻件(高清版).pdf VIP
- 车辆风险预警方法、路侧控制单元及风险预警控制系统.pdf VIP
- 2025年版《中文核心期刊要目总览》.docx VIP
- 密码学基础-密码学.ppt VIP
- 中国国家标准 GB/T 4706.1-2024家用和类似用途电器的安全 第1部分:通用要求.pdf
- 灯具安装技术交底1.docx VIP
- 乙烯三机:发展与未来.pptx VIP
- NB/T 47008-2017 承压设备用碳素钢和合金钢锻件.pdf VIP
- 密钥管理与密钥分配现代密码学.ppt VIP
- 初中信息技术校本课程《遨游3D世界,利用三维设计软件制作创意作品》教案.doc VIP
文档评论(0)