复杂背景图像中的文字提取技术研究-模式识别与智能系统专业论文.docx

下载文档 降价啦

9
0
约4.9万字
约 67页
2018-12-06 发布于上海
举报
版权申诉
保障服务

复杂背景图像中的文字提取技术研究-模式识别与智能系统专业论文.docx

1、本文档共67页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

复杂背景图像中的文字提取技术研究-模式识别与智能系统专业论文

RESEARCH ON TEXT EXTRACTION FROM IMAGE WITH COMPLEX BACKGROUND A Dissertation submitted in fulfillment of the requirements of the degree of MASTER OF PHILOSOPHY from Shandong University of Science and Technology by Xie Peng Supervisor: Professor Su Xuecheng College of Information and Electrical Engineering May 2008 声明本人呈交给山东科技大学的这篇硕士学位论文，除了所列参考文献和世所公认的文献外，全部是本人在导师指导下的研究成果。该论文资料尚没有呈交于其它任何学术机关作鉴定。硕士生签名：日期： AFFIRMATION I declare that this dissertation, submitted in fulfillment of the requirements for the award of Master of Philosophy in Shandong University of Science and Technology, is wholly my own work unless referenced of acknowledge. The document has not been submitted for qualification at any other academic institute. Signature: Date: 山东科技大学硕士学位论文摘要山东科技大学硕士学位论文摘要摘要图像和视频中包含的文字信息是理解图像和视频内容的重要线索，有效地提取这些文字信息对基于内容的图像信息检索系统来说是一项重要的技术。由于图像和视频中的文字通常叠加在复杂的背景之上，背景成分的干扰使得现有的 OCR 技术难以识别出这些文字，从而限制了 OCR 技术的成功应用。因此，如何从具有复杂背景的图像和视频中提取文字信息成为一个重要的研究课题。对于复杂背景中的文字检测，本文使用了多尺度的小波变换特征和标记算法相结合的方法。首先，应用小波半软阈值法去除图像噪声；然后利用 Mallat 塔式分解方法获取图像的高频特征信息，并计算得到各分量的特征能量。本文对特征能量的阈值选取方法做了改进，根据图像中文字的特点使用双阈值法检测文字，实现文字的粗定位；最后，使用标记算法对文字进行细定位，从而将候选文字像素连接成为完整的文字区域。实验表明，该方法能够快速、准确地检测出图像和视频中的文字。在检测出图像中的文字后，本文采用非监督参数估计方法建立高斯混合模型进行文字分割。首先利用改进的“边缘对”采样方法，在 Canny 边缘检测结果的基础上，通过变尺度法实现对“边缘对”之间的像素采样；然后，对采样像素建立 HIS 颜色模型，并使用 HIS 颜色模型中的色度分量作为特征；最后，本文对像素概率计算方法做了改进，提出通过计算像素区域概率的方法分割文字，即根据色度相同的像素其高斯分布概率相近的特点进行快速分割，这样可以避免以往逐个计算像素概率导致计算量过大的问题。这种先采样后利用区域概率的分割方法大大提高了文字分割效率。最后，研究了字符分割和识别问题。本文采用投影法分割字符，该方法是通过从上至下，从左至右扫描图像，将图像中的文字分割成可以输入 OCR 识别系统的单个字符。在字符识别中，本文没有使用单一的结构特征或者统计特征，而是结合了两者的优点，将每个字符对应到横、竖、撇、捺四个笔画子方向上，然后计算网格笔画向量作为特征，并应用最近邻法对向量进行分类来识别字符。大量实验表明,该方法能够取得满意的识别结果。关键词：小波变换、特征能量、文字检测、文字分割、字符识别 ABSTRACT Text in the images and video contains rich semantic information, which is an important clue to understand the contents of the images and video. For content-based image information retrieval system, extracting the text effectively is an important technology. As the text in the images and