视频与图像处理-文字特征提取.doc

视频与图像处理-文字特征提取

图像文本提取算法研究 摘 要: 根据图像中文字与背景区城的形态特征,提出了一种基于形态运算和连通域标记的复杂背景图像文档提取算法。实验结果表明,即使在图像分辨率不高以及文字布局较复杂的情况下,该算法仍然较快较准确地提取出复杂背景图像中的文字。 关键词: Ostu,二值化,形态学,连通域 1 引 言 近年来,随着计算机和网络技术的发展,网页上的数字化图像和视频呈现爆炸式增长。而随着移动数码摄像设备的普及,用户也可以方便地使用移动设备拍摄自然场景中的数字化图像。同时,传统的图书馆为了满足用户对多媒体内容的查询需求,也开始收藏图像和音视频等内容。多样的信息给人们的生产和生活带来了巨大便利的同时,也使如何能让用户准确迅速地找到自己所需的多媒体内容成为日益突出和紧迫的需求,因而也需要有效的方法来组织和检索这些多媒体内容。 以往的文档分析与识别领域,主要着眼于对一些布局较有规律的二值文档进行字符/图形分割与识别。目前,随着WWW页面中图片的大量使用,以及图像、视频数据库的广泛应用,使得图像成为另一种重要的信息载体。Loprest指出,互联网上相当一部分文字是嵌入在图像中的,而且其中大部分文字并没有在HTML页面的其他地方重复出现[1]。Wong则认为视频图像中的文字可为我们提供关于该视频产品的丰富语义信息图。不幸的是,目前大多数的搜索引擎都无法直接对嵌人在图像中的文字内容进行检索。因此

文档评论(0)

1亿VIP精品文档

相关文档