- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用MATLAB确定图像中某一字母位置
用MATLAB确定图像中字母的区域
姓名:张坤峰
学号目录
1 绪论 3
1.1引言 3
1.2背景及意义 3
1.3字符识别原理概述 3
1.4主要工作 4
2图像预处理 5
2.1输入待处理的原始图像: 5
2.2图像的灰度化: 5
2.3进行开操作得到背景图像: 6
2.4对图像进行增强处理: 6
2.5取得最佳阈值,图像二值化: 7
3字母的定位 8
3.1设计算法 8
3.2图像的变换公式 8
3.3主程序 9
3.4 结果及分析 9
4总结 10
1 绪论
1.1引言
视觉信息是人的主要感觉来源,人类认识外在世界的信息很多是通过视觉提供的。人类是通过眼睛与大脑来获取、处理和理解视觉信息的。视觉不仅指对光信号的感受,它包括了对视觉信息的获取、传输、处理、存储与理解的全过程。·语言和文字是人类文明的标志,也是人们进行交流和沟通的主要媒介。
随着计算机、信息技术的高速发展,使用计算机处理和识别文字信息也就成为了一个非常重要的研究领域。计算机文字识别,又称之为光电字符识别(Optical Character Recognition,OCR),就是利用一定的光电设备将印刷或手写在纸(或其它介质)上的字符输入到计算机中并对其进行自动辨识。字符识别技术是模式识别的一个重要分支,它涉及模式识别、图像处理、数字信号处理、自然语言理解、人工智能、模糊数学、信息论、计算机等学科,是一门综合性技术。
1.2背景及意义
计算机视觉研究的主要是通过计算机分析景物的二维图像,从中获得三维世界的结构和属性等信息。目前,计算机视觉己在遥感图像分析、文字识别、医学图像处理等领域取得了广泛应用。
尽管人们对字符识别的研究已从事了很长时间,并已取得了很多成果,但到目前为止,机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题,因此它们对于模式识别等学科和理论来说,仍有较强的研究价值和意义。同时,字符识别的研究,对于进一步提高复杂环境条件下的文字识别的准确率,解决视频图像的文字检测和识别,手写体等各种文字的识别,以及对各种图像识别技术和应用问题,都具有重要的借鉴和启发作用。
1.3字符识别原理概述
字符识别实质上就是由计算机自动识别各种字符,生成计算机可识别的内部编码。
本文内容是字母识别。目前,字母识别中有两个主要研究方向,一是新的识别算法的研究,使得一些复杂的或运算量大的算法能够得以实现。二是集成方法的研究,字符集成识别是综合集成方法论与字符识别技术的结合。它一方面寻求新的特征提取和识别方法,另一方面着眼于系统的体系结构。由于采用多种识别方法,多种字符特征,并针对具体问题有效地将多个识别器组合管理起来,特征之间具有多样化的关系,最终的识别效果通常会优于每一个成员分类器。
一个基本的字符识别系统可以用下面的框图来概括,主要由计算机视觉系统和模式识别系统两大部分组成,其中计算机视觉系统包括图像的采集模块、图像的预处理模块和图像分割模块,模式识别系统包括特征提取模块和识别模块,如图1.1所示:
图像的采集是指借助光学数字影像设备(光学扫描仪,数码相机,数码摄像机)将需要识别的字符图像转换成数字图像输入到计算机系统。
图像预处理是把原始图像转化为较为理想的灰度图像,去除图像中的噪声畸变等现象,增强图像中有用的信息,以便于识别。预处理是字符识别的第一步,占有十分重要的地位,预处理的好坏将直接影响识别方法的难易及识别结果的好坏。预处理做得好,使反映字符本质特征的部分突显出来,识别率高且识别速度快。反之,就会使识别变得困难,甚至造成误识。
图像分割模块是将图像中的目标从背景中分割出来,这一步也至关重要。
特征提取是将待识别图像中有代表性的特征提取出来,并对提取的大量特征进行简化和分类,以便于识别。字符特征一般分为两大类:结构特征和统计特征。
最后所提取的特征交给分类器模块进行比较计算,给出鉴别结果。
字符识别的后处理是指根据字符所处的上下文或者其它约束条件,对识别结果的校正或检验。
在本文中我们的工作内容到图像的分割模块。
1.4主要工作
字符识别具有广阔的前景,仍有许多技术难点需要解决。本文研究了字母块图像预处理、特征提取、字母分割的过程,主要有以下几个方面的工作:
(1) 预处理阶段
本文的研究对象是字母的识别,其背景单一但难以区分,但字母数量有限,且是印刷体,形状规则。根据以上特点,本文首先将图像进行灰度化,将图像转换为只包含亮度信息的灰度图像,以达到改善画质和增强对比度的目的;其次对图像进行了增强操作,突出图像中感兴趣的区域。图像增强实质上消除或减弱噪声,改善图像质量,使图像变清晰的过程。
在预处理阶段,本文还研究了图像的平滑去噪,抑制或减弱了噪声影响,达到改善画质的目的。最后的处理阶段是图像的边缘检测,根据图像
文档评论(0)