- 1、本文档共67页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
复杂背景图像中的文字提取技术研究-模式识别与智能系统专业论文
RESEARCH ON TEXT EXTRACTION FROM IMAGE WITH COMPLEX BACKGROUND
A Dissertation submitted in fulfillment of the requirements of the degree of
MASTER OF PHILOSOPHY
from
Shandong University of Science and Technology
by
Xie Peng
Supervisor: Professor Su Xuecheng
College of Information and Electrical Engineering
May 2008
声 明
本人呈交给山东科技大学的这篇硕士学位论文,除了所列参考文献和世所 公认的文献外,全部是本人在导师指导下的研究成果。该论文资料尚没有呈交 于其它任何学术机关作鉴定。
硕士生签名: 日 期:
AFFIRMATION
I declare that this dissertation, submitted in fulfillment of the requirements for the award of Master of Philosophy in Shandong University of Science and Technology, is wholly my own work unless referenced of acknowledge. The document has not been submitted for qualification at any other academic institute.
Signature: Date:
山东科技大学硕士学位论文摘要
山东科技大学硕士学位论文
摘要
摘 要
图像和视频中包含的文字信息是理解图像和视频内容的重要线索,有效地提取这些 文字信息对基于内容的图像信息检索系统来说是一项重要的技术。由于图像和视频中的 文字通常叠加在复杂的背景之上,背景成分的干扰使得现有的 OCR 技术难以识别出这 些文字,从而限制了 OCR 技术的成功应用。因此,如何从具有复杂背景的图像和视频 中提取文字信息成为一个重要的研究课题。
对于复杂背景中的文字检测,本文使用了多尺度的小波变换特征和标记算法相结合 的方法。首先,应用小波半软阈值法去除图像噪声;然后利用 Mallat 塔式分解方法获取 图像的高频特征信息,并计算得到各分量的特征能量。本文对特征能量的阈值选取方法 做了改进,根据图像中文字的特点使用双阈值法检测文字,实现文字的粗定位;最后, 使用标记算法对文字进行细定位,从而将候选文字像素连接成为完整的文字区域。实验 表明,该方法能够快速、准确地检测出图像和视频中的文字。
在检测出图像中的文字后,本文采用非监督参数估计方法建立高斯混合模型进行文 字分割。首先利用改进的“边缘对”采样方法,在 Canny 边缘检测结果的基础上,通过 变尺度法实现对“边缘对”之间的像素采样;然后,对采样像素建立 HIS 颜色模型,并 使用 HIS 颜色模型中的色度分量作为特征;最后,本文对像素概率计算方法做了改进, 提出通过计算像素区域概率的方法分割文字,即根据色度相同的像素其高斯分布概率相 近的特点进行快速分割,这样可以避免以往逐个计算像素概率导致计算量过大的问题。 这种先采样后利用区域概率的分割方法大大提高了文字分割效率。
最后,研究了字符分割和识别问题。本文采用投影法分割字符,该方法是通过从上 至下,从左至右扫描图像,将图像中的文字分割成可以输入 OCR 识别系统的单个字符。 在字符识别中,本文没有使用单一的结构特征或者统计特征,而是结合了两者的优点, 将每个字符对应到横、竖、撇、捺四个笔画子方向上,然后计算网格笔画向量作为特征, 并应用最近邻法对向量进行分类来识别字符。大量实验表明,该方法能够取得满意的识别 结果。
关键词: 小波变换、特征能量、文字检测、文字分割、字符识别
ABSTRACT
Text in the images and video contains rich semantic information, which is an important clue to understand the contents of the images and video. For content-based image information retrieval system, extracting the text effectively is an important technology. As the text in the images and
您可能关注的文档
- 复杂地形下典型地物目标热遥感成像仿真研究-工程热物理专业论文.docx
- 复杂地形条件下可控源音频大地电磁法2D正演数值模拟研究-地球探测与信息技术专业论文.docx
- 复杂地形环境下新型轮腿复合式移动机器人控制系统研究-机械制造及其自动化专业论文.docx
- 复杂地形环境下轮腿机器人稳定性研究-机械工程专业论文.docx
- 复杂地形电导率线性变化二维大地电磁有限单元法正演模拟-地球探测与信息技术专业论文.docx
- 复杂地质条件下地道结构不均匀沉降的数值模拟研究-建筑与土木工程专业论文.docx
- 复杂地质条件下巷道稳定性分析与地压控制研究-岩土工程专业论文.docx
- 复杂地质条件下煤炭开采诱发地表裂缝成因研究-大地测量学与测量工程专业论文.docx
- 复杂地质条件下支护方式对调压井施工期围岩稳定的影响研究-水利工程专业论文.docx
- 复杂地质条件下深部开采岩体移动变形分析-岩土工程专业论文.docx
- 复杂背景图像中的文字提取算法研究-控制工程专业论文.docx
- 复杂背景条件下运动目标检测与跟踪算法的研究-仪器科学与技术专业论文.docx
- 复杂胫骨平台骨折的手术疗效评估-外科学专业论文.docx
- 复杂背景建模与运动目标检测算法研究-计算机系统结构专业论文.docx
- 复杂脑效用性网络研究-通信与信息系统专业论文.docx
- 复杂脾切除手术方法体会-外科学(普外科)专业论文.docx
- 复杂航迹下视SAR原理与算法研究-信号与信息处理专业论文.docx
- 复杂船舶电力系统的脆性建模仿真研究-控制理论与控制工程专业论文.docx
- 复杂船舶电力系统的脆性建模仿真分析-控制理论与控制工程专业论文.docx
- 复杂荷载作用下浅埋大跨地下拱结构的合理拱轴线研究-结构工程专业论文.docx
最近下载
- 2024年江西电力职业技术学院单招职业技能测试题库及答案(各地真题).docx VIP
- 2024年上海市高职单招职业适应性测试试题及答案解析.docx
- 南京市某办公楼空调系统设计.doc VIP
- 2024 小米SU7 Pro Max 用户手册.pdf VIP
- 基于Python的仓储信息管理系统的设计与实.doc
- 《十万个为什么》整本书阅读分享课(教学设计)2023-2024学年统编版语文四年级下册.docx
- GB50210-2018 建筑装饰装修工程质量验收标准.doc VIP
- 2025年湖北省“新八校”协作体高三2月联考数学试卷(含答案解析).pdf
- 教师招聘考试题库《教育理论综合知识》考点预测256.docx
- 蜘蛛的分类.pdf
文档评论(0)