- 3
- 0
- 约1.93万字
- 约 37页
- 2017-06-19 发布于辽宁
- 举报
彩色图像中文本提取的算法研究本科论文
1 绪论
随着互联网和多媒体技术的快速发展,世界进入了一个崭新的信息化时代。以图像、动画、视频为主要元素的各种多媒体信息构成了信息传播的主力。最近几年以来随着既有拍照功能的便携式电子设备,比如智能手机,平板电脑等,随着技术的不断更新升级,人们急需一种方便的应用程序来提取处理图像中内嵌的文本信息。这都使得彩色图像下的文本的提取成为一个很有意义的研究课题。彩色图像中的文本提取即为彩色图像中文本定位,是很困难的问题。由于其广泛的应用领域越来越受到人们的重视。 因此,将图像中的文本提取出来将便于不停国家,不同文化之间的交流。
1.1研究意义和背景
随着计算机技术、多媒体技术和通讯技术的发展,以图像、声音和视频为主的多媒体信息的应用越来越广泛,图像中的文本信息对检索和浏览有十分重要的意义。在彩色图像中,文本信息包含了丰富的高层语义信息[]。文本可以作为图像的内容标识和索引,是图像内容重要程度的判断依据,例如出现醒目文字的帧,可以抽取出来作为对应的图像的代表帧。如果这些文字信息能自动准确的被检测、分割、识别出来,则对图像高层语义的自动理解、索引和检索是非常有价值的。
人们对中文字进行了广泛的研究,并已有许多成熟的技术应用在各个领域,如交通管理中的汽车牌照识别和港口货物管理的集装箱编码识别等。但自然场景中的文本分割依然面临着许多复杂的问题主要原因是:(1)文字和其他自然景物混杂在一起,如树、窗户和房屋建筑等,背景复杂(2)文字的颜色多种多样;(3)文字的字体和大小复杂多变;(4)光照的变化等。因此从自然场景图像中提取文本是一项极具挑战性的工作。目前已有的文本区域提取方法大致可以分为四类基于边缘的方法基于纹理的方法基于连通域的方法基于学习的方。
1.2课题发展现状
针对图像、视频文本检测和提取的研究,主要有以下算法:
Rainer Lienhart[]利用文字颜色的单一性、文本区域的大小约束、同一文本会在连续几个视频帧出现等特点,对文本进行检测和定位。首先对视频帧使用分裂—合并算法,将视频帧分解成颜色一致的连通元(connected component)。然后通过匹配算法,对连通元进行多帧跟踪,去除那些没有连续多帧出现的连通元。最后通过对比度的分析,形状分析等去除非文本的连通元。该算法要对每一个视频帧进行分裂合并算法,而且视频中生成的连通元绝大部分都不会是文本,因此算法复杂度太高,系统效率低。
Boon -Lock Yeo[]提出利用场景变化来检测视频文本的出现和消失。算法对相邻两个视频帧取差值,在差值图像中寻找高亮区域。这种算法只能提取高亮的视频字幕,而不能提取非高亮度的字幕,而且也会受到较亮的物体的干扰。
Byung[]提出用字符的拓扑结构特征来提取字符文本区域,然后对视频字幕区域进行复原。该算法是基于单个视频帧图像的字幕提取,效果并不明显。
Marco Bertin]利用角点特征来进行的视频字幕检测。这种算法实质上类似于基于灰度边缘的算法等。
王辰等[]等通过灰度边缘检测来定位文本区域。首先提取视频帧的灰度边缘,然后合并相邻的边缘,生成候选文本区域,最后用一些启发式规则来去除虚假的文本区域。该算法不能提取灰度值和背景接近的文本。
王勇等[]提出一种基于边缘点密度的视频字幕自适应检测算法。采用基于边缘检测的方法,结合文字图像区域本身的特点,在对原图像进行边缘检测和形态学膨胀后,对其在水平和垂直方向的边缘密度投影采用一种自适应的检测算法,从而检测得到字幕图像区域。该算法的优点是可以检测出各种字体大小的文本行。但是算法不能提取灰度值和背景接近的文本。
郭丽等[]提出一种基于颜色边缘点和游程平滑的视频文本提取算法。黄晓东等[15]综合应用小波变换和颜色聚类技术来提取视频帧中的字幕区域。首先,通过小波变换计算视频中的局部能力特征,能量高的区域作为候选字幕区域。然后利用字幕颜色一致的特征,进行邻域颜色聚类算法,从背景中分离出字幕。最后利用字幕属性特征消除噪声。但是该算法容易受到颜色一致的物体的干扰。处理图像的时间较长
1.3本文主要研究方向
课题的主要目标就是在彩色图像下提取文本信息,二值化分OCR软件识别并被转化成为机器内码,结合自然语言处理,文本检索,文本翻译,
对图像中文字的提取首先确定包含文字的图像区域,滤除非文本背景的干扰,把彩色图像中的文本区域定位出来,这是文字提取工作中最难、最关键的环节,确定包含文字图像的区域后,利用文本特征制定启发式规则,滤除非文本区域,得到二值化文本字符,为了方便后面的文字抽取,在字符抽取前进行一次文字区域图像质量的改善也很有必要,对文字提取后,最终采用OCR技术对字符进行识别。
1.4本文主要内容与安排
论文从课题出发,第一章绪论中阐述了彩色图像中文本信息提取的四种方式,然后比较对于不同场景和复杂背
您可能关注的文档
- 保单方案设计人身保险课程设计本科论文.doc
- 宝石研磨机设计3d本科论文.doc
- 保利银滩外装饰工程施工组织设计方案本科论文.doc
- 杯子的人性化设计分析本科论文.doc
- 北京某大型商场办公区装修技术标施工组织设计本科论文.doc
- 北京汽车股份有限公司新能源电动车发展分析本科论文.doc
- 北京市古城创业大厦电气设计本科论文.doc
- 北京市某电子厂房工艺性空调工程设计本科论文.doc
- 北京市某综合楼中央空调系统设计本科论文.doc
- 北信公司网络规划设计与实施方案本科论文.doc
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
最近下载
- 宝城期货-原油2026年度报告-油海浮沉浪几重,掣鲸博弈破苍穹.pdf VIP
- 学堂在线 雨课堂 学堂云 临床中成药应用 综合考试答案.docx VIP
- 2018年1月13日山东济南事业单位考试《公共基础知识》(客观题部分).docx
- 食品生物技术-绪论.pptx VIP
- 2025年青岛职业技术学院单招笔试英语试题库含答案解析.docx VIP
- 中外建筑史7-近现代建筑.pptx VIP
- 2025年云南省中考生物真题(原卷).pdf
- 高中奥林匹克物理竞赛解题方法集.pdf VIP
- 梁小民西方经济学基础教程(第三版)第01章.ppt VIP
- 小学英语语法代词省公开课一等奖全国示范课微课金奖课件.pptx VIP
原创力文档

文档评论(0)