开题报告苗雨晖..docVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
开题报告苗雨晖.

[注意:在撰写开题报告时,页面设置和排版严格根据本格式] 南京工程学院 自动化学院 本科毕业设计(论文)开题报告 题 目: 专 业: 测控技术与仪器 班 级: 学 号: 学生姓名: 指导教师: 2016年3月 本科毕业设计(论文)开题报告 学生姓名 苗雨晖 学 号 240121112 专 业 测控技术与仪器 指导教师 曹未丰 职 称 实验师 所在院系 自动化院 课题来源 课题性质 课题名称 印刷字符的计算机识别 毕业设计的内容和意义? 光学字符识别(Optical?Character?Recognition,简称OCR)用计算机自动辨识印刷在纸上和人写在纸(或介质)上的文字。它涉及到计算机数字图像处理、模式识别、人工智能、模糊数学、组合数学等学科。获得文字图像信息非常重要,但更重要的是对文字图像进行处理,从中找到我们所需要的信息,因此在当今科学技术迅速发展的时代,对文字图像的处理技术提出了更高的要求,能够更加快速准确的获得有用信息。本文主要实现对印刷字符的识别与输出。阶段性任务如下: 确定字符的识别方法。 编写相应软件的代码。 做匹配模板。 用软件读模板,实现人机交互。 软件调试,测试系统。 字符识别综合了数字图像处理、计算机图形学和人工智能等多方面知识,越来越成为计算机自动化和智能化的重要技术。 文本的的自动识别可以提高效率节省资源,具有重大的经济、社会效益。 更可以通过文字演变成图片甚至动态的物体,对实现自动化有着重要的意义。 通过学习数字图像处理和MATLAB软件的应用,了解边缘检测处理对文字图像的理论基础和过程,用MATLAB软件对文字图像进行检测。该课题在研究过程中主要要解决如何运用MATLAB语言实现对文字图像进行增强、检测、和定位,把文字图像中的有用信息提取出来,其中的关键在于MATLAB语句的编写。 文 献 综 述 基本原理: 模式识别是对感知信号(图像、视频和声音等)进行分析,对其中的物体对象或行为进行判别和解释的过程。 模式识别的一般过程包括以下几个步骤:信号预处理、模式分割、特征提取、模式分类和上下文后处理。信号预处理是通过消除信号、图像、视频中的噪声来改善模式和背景的可分离性;模式分割是将对象模式从背景分离或将多个模式分开的过程;特征提取是从模式中提取表示该模式结构或性质的特征并用一个数据结构来表示;在特征表示基础上,分类器将模式判别为属于某个类别或赋予其属于某些类别的概率;后处理则是利用对象模式与周围模式的相关性验证模式类别的过程。 基本特点: 认知是一个把未知与已知联系起来的过程。对一个复杂的视觉系统来说,他的内部常同时存在着多种输入和其他知识共存的表达形式。感知是把视觉输入与事先已有表达结合的过程,而识别与需要建立或发现各种内部表达式之间的联系。匹配就是建立这些联系的技术和过程,通过从图像里提取出来的特性用与设定的模板进行对比,正确高效的找到与我们有用的信息,建立联系,用已知解释未知[1]。其中识别方法大概分为6种 模板匹配法[2]~[6] 统计决策法 结构特性法 模糊辨别法 逻辑推理法 神经网络法[7]~[11] 国内外研究进展 OCR在上世纪40年代兴起,现在已经进入成熟阶段。像英语这样的语言已经有完OCR包[12]。我国也从实验室走出来,已经有文通、汉王等著名识别系统。相比较发达国家的广泛应用[13]~[16],OCR文字识别技术在国内各行业还都有着广阔的空间。目前主要的识别方式有以下几种 模板匹配法; 模板匹配法有2种,一种是进行提取后与模板匹配,一种是不提取特性,直接将字符点阵与模板进行匹配。如果进行特征提取,对输入特征矢量的选取是否全面刻画字符的特征将直接影响识别结果。如果不进行特征提取,将输入的字符点阵直接与模板库做匹配的话,要将字符放大或缩小至模板同样大小的尺寸,即大小归一化才能匹配。 对于一些相似的字符,如果倾斜或者字体变化都会影响到识别的结果,所以很难一次成功,需要进行二次识别,例如O和Q,8和B等,再次识别的时候,可以搜索字符的笔画,如区分O和Q,可以搜索字符的右下角,如果多出来的认为是Q否则为O。这样,经过二次识别之后可以有效的提高字符的识别率。 基于字符结构的方法 这个做法就不用做大小归一化的处理了,归一化的处理过程有可能会失去字符的信息,造成图像的失真。字符的结构化可以有效的避免信息的丢失,提高识别速度。 印刷体的字符结构固定,笔画规范,很少有噪声等干扰项。但是汉字的结构复杂,字数繁多,所以这种方法跟适合字母和数字的识别。 字母

文档评论(0)

dsf80fhg0j + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档