- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
                        查看更多
                        
                    
                基于三维边缘重构图像自动矫正方法
                    基于三维边缘重构图像自动矫正方法
    摘要:针对照相机对装订书籍拍照时由于书面弯曲产生文档图像变形的问题,利用从图像中提取的文档边缘作为特征信息,通过参数控制自动实现文档图像的矫正。与以往研究成果相比,本方法无须人工标记及特殊设备,具有一定的优越性。实验结果能够有效地对变形文档图像进行矫正。 
  关键词:文档图像; 变形; 矫正; 三维重构; 曲面参数化 
  中图分类号:TP391.41文献标志码:A 
  文章编号:1001-3695(2007)07-0315-03 
   
  0引言 
   
  文档数字化通常均由扫描仪获得。然而,随着数字照相机高性能、低价位的发展趋势,其在文档分析中的应用成为一个研究热点。较之传统的扫描仪,数字照相机体积小、重量轻、携带方便,并且可以很容易地结合到其他数字产品中去;它们受到的环境约束小,可以对厚重的书籍、大幅报纸、脆弱的历史文档甚至是背景环境中的文字拍照。因此,基于数字照相机的文档分析是一项非常有意义的研究工作[1]。?? 
  然而,将照相机作为数字化输入设备有很多问题需要解决,如文档表面变形、分辨率过低、光照不均、背景复杂等。其中由书籍表面弯曲造成的图像变形是非常重要的问题。这种变形的后果是图像中文字行由直线变成曲线,文字图像存在挤压和扭曲,大大降低了光字符识别(OCR)率,并且给进 
  一步的文档结构分析和理解造成困难。因此必须通过图像矫正的方法对弯曲变形的文档进行恢复。 
   
  1现有矫正方法概述?? 
   
  针对文档图像变形问题,国内外研究人员已经取得了一些成果和方法。从特征信息提取的来源和方式上,大致可分为三类:①利用特殊设备从文档图像中提取深度信息,如利用投影仪作结构光源设计出3D形状采集系统,获得文档的深度图像[2,3]。这类方法矫正精度较高,但计算成本大,需要昂贵的摄影设备并需要精确标定,适用于图书馆珍贵书籍的数字化保存。②从文档图像内容中获得变形特征,如通过跟踪图像中弯曲文本线得到文档表面变形的信息,再利用其恢复文档表面3D形状对图像进行矫正[4,5] 。该方法中,文本线的跟踪较易出现交叉、断行等现象,且对文档内容的依赖较强,不适应图像、表格较多时的情况。③称为基于边缘的矫正方法[6]。它从图像中的文档边缘提取3D深度信息,再利用曲面参数化方法实现整张文档图像的矫正。这种方法曾实现了弯曲变形的印刷艺术品图像的矫正,其特征提取简单且与文档内容无关,实验得到的矫正效果较好,是数字照相机文档分析领域中值得关注和研究的一类方法。?? 
  当前研究中,基于边缘的矫正方法还需要较多的人工辅助。一般需要人为地在文档(或书页)边缘上标出一系列在真实的3D边缘曲线上等弧长分布的点(在本文中称为等距控制点),进而从二维文档图像中获得三维深度信息。当矫正书页较多时这种方法的效率会比较低。?? 
  本文将提出一种自动矫正的方法,希望在参数控制下,只需对文档拍照,通过算法的实现自动输出矫正图像。由于投影成像使信息产生失真,直接从二维图像上找不到标志变形程度的信息,必须通过三维重构实现。?? 
   
  2文档图像边缘的三维重构?? 
   
  三维重构的目的在于找到三维书页边缘上等距控制点与其在图像上位置的对应关系。图1是一张典型的由照相机拍摄到的文档图像。可以明显看到文字行变成曲线,且图像中的文字均存在扭曲。?? 
  前述的对印刷艺术品图像的矫正方法[6],是借助一张黑白方格交错形成的棋盘纸完成的。棋盘纸紧贴在变形的艺术品下面,使之产生一致的变形。拍照后,借助于黑白格的引导,便可以从艺术品图像中的边缘线上找到等距控制点,它们在图像中的位置分布体现了文档3D表面的深度变化,是图像矫正所依据的特征信息。该方法使用的棋盘纸需要进行人工制作,其控制点事实上是人为标出的。?? 
  本文将重构出图像中文档边缘的三维形状,通过计算可以自动求出等距控制点与其在图像中位置的对应关系。3D曲线到其2D图像之间的转换关系可以通过几何成像的理论求得[5]。将相机看作透镜系统,此时的成像可看作透视投影变换,如图2所示。?? 
   
  3实验及结果比较?? 
   
  根据上述介绍的基于3D边缘重构的文档图像自动矫正算法,完成了曲面文档的矫正实验。首先对弯曲的书面文档拍照,如图1所示。图1中,??h??=31 cm,??H??=1 704,相机到书面的近似深度为??s??(0)≈60 cm。?? 
  以书页的中缝为左边缘线对图像进行处理。跟踪边缘时,首先对图像进行二值化,然后运用8邻域跟踪的方法,并通过5像素的平滑处理去掉边缘曲线的噪声。经过边缘曲线的三维重构后,实验得到图1页面的上边缘3D形状及其上的等距控制点位置如图5所示。各条边缘线的等距控制点围成的区域即为需要矫正的
                
原创力文档
                        

文档评论(0)