- 7
- 0
- 约3.15千字
- 约 7页
- 2018-03-29 发布于江苏
- 举报
场景文本提取方法应用研究论文
摘要场景图像中的文本提供了重要的语义信息,它是图像内容的重要来源。针对当前的求解算法普遍存在提取文本精确度不高等缺点,本文提出了一种有效的文本提取方法。首先对原始图片进行模糊化处理,然后进行Laplacian边缘提取和二值化,再形态学变化,最后进行连通域分析,实现了场景文本的提取。
关键词文本提取;边缘检测;二值化;连通域分析
0引言
随着计算机、多媒体以及通讯技术的飞速发展,相当数量的文字信息正越来越多地以图像形式出现[1]。图像中的文字是图像内容的一个重要来源,如果这些文字能自动地被检测、分割、识别出来,则对图像语义的自动理解、索引和检索是非常有价值的[4]。图像文本可以分为人工文本和场景文本。人工文本是指人工加在图像上的文本,场景文本是图像上本身存在的文本,如广告牌或运动员球衣上的号码等。由于场景文本图像具有较为复杂的背景,同时受光线和文本的字体、颜色、位置等因素影响较大,往往很难被检测、提取和识别,因此自动从场景中提取文本是一项极具挑战性的工作。目前已有的文本区域提取方法大致可以分为三类:基于连通域的方法,基于纹理的方法和基于边缘的方法[2]。基于连通域的方法速度快,但是当背景复杂或文本与背景颜色相近时分割困难,而基于纹理的方法非常费时而且处理复杂背景时误报比较多。
本文根据场景中的文本区域与背景对比度强,存在丰富的边缘信
原创力文档

文档评论(0)