基于饱和度和分水岭算法的视频图像内文字的提取.doc

基于饱和度和分水岭算法的视频图像内文字的提取.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于饱和度和分水岭算法的视频图像内文字的提取

图像内文字区域的提取的新方法 于夏桥 于莉洁 (浙江林学院 浙江 临安 311300) 摘要 本文提出了图像文字提取的新方法,该方法首先对图像进行了光线补偿,并且基于彩色图像饱和度,数学形态学等方法对文字区域进行提取,实验证明该方法对于要处理的问题有很高的准确率。 关键词:光线补偿、彩色图像饱和度、数学形态学 Abstract In this paper, we proposed a new method about extracting the text from the image. First the illumination compensation was used to adjust the image. And then we used the method based on the saturation of the color image, mathematical morphology to extract the text region in the image. It was been proved that this method had high accuracy. Key words: illumination compensation, color image saturation, mathematical morphology 随着信息技术的发展和多媒体技术的广泛应用,各行各业的大量信息都在以多媒体信息的方式被数字化。信息数字化使信息能够被广泛的使用、方便的存取以及快速的检索。图像是最为广泛和基本的多媒体信息,对于图像来说,其所含的文本信息在一定程度上反映了该图像的部分重要内容,通常形成对图像内容的简练描述或者说明。例如商业广告种的文本能够提供诸如产品名称,公司名称,公司电话等重要信息;新闻图片的文本能够说明发生事件的时间,地点,涉及到的人物等内容。这些可以帮助人们进一步的对图像进行理解和检索。 图像的文本提取有广泛的应用前景,近年来越来越受到人们的关注。在人们的生产生活过程中有许多地方要应用到文本的提取:例如智能交通领域内汽车牌照的自动提取和识别。其结果可以广泛的应用在:交通流量的检测;交通控制与诱导;机场,港口等出入口车辆的管理等等。又比如,对于一场足球比赛的画面,可以通过提取运动员的队服的号码来了解队员的姓名,身体状况,球队名称并进而对比赛进行注释和索引。对于基于图片的检索,如果采取用物体的形状,颜色,以及其他特征来进行查找,不仅难度大,而且计算量大。因此,自动的图像中的文本区域,并提取这些文本信息,对于它们的识别和分析,对于图像的理解和检索查询是非常重要的。 本文针对复杂背景下的文字,提出了一种基于饱和度信息,彩色图像边缘检测,形态学等方法来提取文字信息,主要的流程如下图所示: 图 1 1. 视频图像的预处理 在我们的研究中所使用的图像,均是使用相机在不同的天气和环境下拍摄而成。在拍摄的过程中会出现光照不均和模糊的现象,这些对于提取文字都是十分不利的,所以我们在图像预处理的过程中需要对这两个方面进行调整。 1.1光线不均的调整 光线不均可能是由于拍摄环境和场景引起的,所以进行光照的调整是十分必要的。图像是由光的反射形成的,如果光源照射到景物上的照度不均,那么强度较强的部分将较亮,照度较弱的部分就较暗,并且由此引起较暗部分的图像细节不易看清。如果没有对于光照不均的调整过程,那么图像将看起来比较模糊。调整以后,我们会发现,图像比以前要更加的亮而且清晰。 主要过程如下: 1. 对于一幅真彩图像,我们利用每一个像素的RGB三个值,将其转换成三个灰度图像,并且将他们定义为I1,I2,I3。 我们分别对于每一个灰度图像来估计背景的亮度。也就是说对于每个灰度图像,我们取32*32大小的小块,这个小块中的最小像素值,我们可以看作是图像背景的照度。我们可以利用这些值形成三个矩阵。 然后用双三次插值将粗略估计处的背景照度矩阵扩展成和原始图像大小相同的矩阵,用J1,J2,J3来表示。 接下来通过如下的等式,我们可以得到三个通过光照补偿的灰度图像R1,R2,R3。 R1=I1-J1; R2=I2-J2; R3=I3-J3 最后,我们将三个灰度图像重新组合成为一个RGB图像,这样我们就完成呢个了光照补偿的过程。其结果如下图1所示 a b 图2 1.2图像的锐化 图像的锐化我们采用的是拉普拉斯算子,拉氏算子比较适用于改善因为光线的漫反射造成也的图像模糊,而且经研究发现,及时模糊不是由于光的漫反射造成的,对图像进行拉氏变换也可以使图像更加清晰。可以发现,图像模糊的部分

您可能关注的文档

文档评论(0)

pangzilva + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档