- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于聚类分析和灰度值匹配碎片文件拼接复原
基于聚类分析和灰度值匹配碎片文件拼接复原
摘要: 针对同一页印刷文字文件的碎纸机破碎纸片的拼接问题,研究了碎纸片内文字行特征,碎纸片的边缘像素灰度特征,提出了基于聚类分析和灰度值匹配的碎片文件拼接算法。通过matlab仿真实验,结果表明该算法可靠地实现了破碎文件的拼接,效果良好。
Abstract: This paper analyzes reconstruction of broken pieces of paper problem which come from the same page of the printed file, studies characteristic of character row and pixel gray level difference of edge of broken pieces of paper, and proposes stitching method for scrapped paper based on clustering analysis and grey value matching. In the end, experiments were run in Matlab 7.0 and the results show that presented algorithm can match ripped-up documents reliably.
关键词: 碎纸拼接;基准图像;空白边界阈值法;聚类分析;像素灰度差异
Key words: reconstruction of ripped-up documents;benchmark image;blank boundary threshold method;clustering analysis;pixel gray level difference
中图分类号:TP391.41 文献标识码:A 文章编号:1006-4311(2013)32-0209-03
作者简介:刘孟娟(1977-),女,陕西大荔人,工程师,主要从事计算机应用技术研究。
0 引言
破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。
常规的文档碎纸片计算机拼接方法一般利用碎片边缘的尖点特征、尖角特征、面积特征等几何特征,搜索与之匹配的相邻碎纸片并进行拼接[1-6],这种基于边界几何特征的拼接方法并不适用于边缘形状相似的碎纸片。针对来自同一页印刷文字文件的碎纸机破碎纸片(既纵切又横切),理想的计算机拼接过程应与拼图游戏手工复原过程类似,即拼接时主要判断碎片内的字迹断线或碎片内的文字内容是否匹配。然而让计算机具备人类的智能识别碎片边缘的字迹断线,理解碎片内文字图像的含义几乎不太可能。但是利用现有的技术,考虑到相邻碎片灰度的差异、碎片文字所在行的几何特征信息,比如文字行的行高、文字行的间距等进行碎片文件的拼接无疑可以避免文字图像的理解,从而实现碎片文件的自动拼接复原。具体过程如图1。
1 碎纸图像预处理
利用扫描仪对碎纸片进行扫描,保证碎纸被扫描的一面在原始位置中属于同一面。为了提高背景分割的精度,对同一次扫描,使用相同的背景颜色,将扫描结果以图像的形式保存下来。图2为一扫描的文件碎片。
在利用扫描仪获得碎纸片的数字化数据之后,预处理包括图像分割、二值化表示两个步骤。图像分割是把图像各具特性的区域(也叫目标)提取出来的过程。考虑到数字化过程中采用了相同的背景色,本文采用最大类间方差法(简称Otsu)进行分割[7-9]。给定一幅具有L个灰度级的图像,其灰度级为[0,1,…,L-1]。图像中灰度级为i的像素的个数记为ni,图像的像素总数可以表示为N=n0+n1+…+nL-1。灰度级i在图像中出现的概率为:p■=■,p■?叟0,■p■=1 (1)
假定通过阈值t将此图像的像素分成C1和C2两类,其中C1表示所有灰度级在[0,1,…,t]范围内的像素集合,C2表示所有灰度级在[t+1,…,L-1围内的像素集合。C1和C2对应图像的目标和背景,反之亦然。这样,C1和C2两个类的概率为:
w■=■p■ w■=■p■ (2)
两个类的均值分别定义为:
μ■=■ip■/w■ μ■=■ip■/w■ (3)
两个类的方差分别定义为:
σ■■=■i-μ■■p■/w■ σ■■=■i-μ■■p■/w■ (4)
则Otsu中的类内方差、类间方差以及总的
您可能关注的文档
最近下载
- 污水处理厂污泥处理处置安全保障措施方案.docx VIP
- 沪教牛津版英语2024七年级上册全册知识清单(记忆版).pdf
- 《项目融资概述》课件.ppt VIP
- 2024安徽职业技术学院招聘笔试真题及参考答案详解1套.docx VIP
- 2025至2030中国汽车检测行业发展分析及发展前景与趋势预测报告.docx VIP
- 如何找回误删微信好友,微信好友一键恢复.doc VIP
- 2025 CSCO前列腺癌诊疗指南.pptx VIP
- 2025年【数学】苏教版数学三年级下册试题5.324时计时法同步练习(含答案).pdf VIP
- 医院培训课件:《医院环境表面及清洁用品的清洁消毒》.pptx
- 《过故人庄》课件.ppt VIP
文档评论(0)