网站大量收购独家精品文档,联系QQ:2885784924

自动识别技术05.ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
二值化:由于彩色图像所含信息量过于巨大,在对图像中印刷体字符进行识别处理前,需要对图像进行二值化处理,使图像只包含黑色的前景信息和白色的背景信息,提升识别处理的效率和精确度。 图像降噪:由于待识别图像的品质受限于输入设备、环境、以及文档的印刷质量,在对图像中印刷体字符进行识别处理前,需要根据噪声的特征对待识别图像进行去噪处理,提升识别处理的精确度。 倾斜校正:由于扫描和拍摄过程涉及人工操作,输入计算机的待识别图像或多或少都会存在一些倾斜,在对图像中印刷体字符进行识别处理前,就需要进行图像方向检测,并校正图像方向。 文字特征抽取 单以识别率而言,特征抽取可说是 OCR的核心,用什么特征、怎么抽取,直接影响识别的好坏。 特征可分为两类: 统计的特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就足以应付了。 结构的特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对,市面上的线上手写输入软件的识别方法多以此种结构的方法为主。 对比数据库:当输入文字算完特征后,不管是用统计或结构的特征,都须有一比对数据库或特征数据库来进行比对,数据库的内容应包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得的特征群组。 对比识别 充分发挥数学运算理论的一个模块,根据不同的特征特性,选用不同的数学函数。 较有名的比对方法: 欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP)、类神经网络的数据库建立及比对、HMM(Hidden Markov Model) 字词后处理:由于OCR的识别率并无法达到百分之百,或想加强比对的正确性及信心值,一些除错或甚至帮忙更正的功能,也成为OCR系统中必要的一个模块。字词后处理就是一例,利用比对后的识别文字与其可能的相似候选字群中,根据前后的识别文字找出最合乎逻辑的词,做更正的功能。 字词数据库:为字词后处理所建立的词库。 人工校正 一个好的OCR软件,除了有一个稳定的影像处理及识别核心,以降低错误率外,人工校正的操作流程及其功能也影响OCR的处理效率。 文字影像与识别文字的对照、屏幕信息摆放的位置、每一识别文字的候选字功能、拒认字的功能、及字词后处理后特意标示出可能有问题的字词,都是为使用者设计尽量少使用键盘的一种功能。 结果输出 有人要文本文件,有人要和输入文件一样的原文重现,有人注重表格内的文字……无论怎么变化,都只是输出档案格式的变化而已。 识别系统性能的评价 对一个手写数字识别系统,可以用三方面的指标表征系统的性能: 正确识别率A=正确识别样本数/全部样本数*100% 替代率(误识率)S=误识样本数/全部样本数*100% 拒识率R=拒识样本数/全部样本数*100% 三者的关系是:A+S+R=100% 识别精度P=A/(A+S)*100%。 五、汽车牌照自动识别系统 车牌识别是现代交通管理的重要措施,是智能交通系统的重要环节。 内容 车牌识别系统是采用数字摄像技术和计算机信息管理技术,对运行车辆实现智能管理的综合运用技术 理论基础 数字图像处理和模式识别 车牌识别技术具有典型性,容易推广到其它识别对象。 主要应用领域 公安卡口 高速公路收费管理 城市道路监控系统(电子警察) 海关车辆管理 停车场管理 车辆流量统计 …… 车牌识别系统组成 识别流程 主要由三部分组成 图像捕获一般采用CCD(Charge-coupled Device,电荷耦合元件)摄像头,包括整车图像或牌照(一般为彩色图像) 后两步由计算机实现 关键是第三步:字符识别(OCR) 识别步骤(不是唯一的) 获取整车或局部图像; 对获取的车辆数字图像进行预处理; 车牌定位; 二值转换; 车牌分类; 车牌分割; 字符识别; 结果优化(车牌模糊识别)。 车牌定位 通过车牌区域的特征来判别牌照的位置,将车牌从图像中分割出来。 步骤 彩色图像灰度化 图像增强 边缘检测 模板匹配 输出牌照子图像 CCD捕获的汽车图像 彩色图像灰度化 灰度增强改变对比度 定位、分割后输出 车徽边缘提取与识别 车牌图像特征 车牌定位与分割的理论与方法是根据车牌图像的特点来确定的。 车牌图像主要特征 车牌区域内的边缘灰度直方图统计特征 车牌的几何特征 车牌区域的灰度分布特征 车牌区域的水平、垂直投影特征 车牌形状特征和字符排列格式特征 车牌的形态学特征 频谱特征 车牌图像的组成 内容:省份简称汉字(或其他汉字)+字母或阿拉伯数字,共7位,即 :X1X2?X3X4X5X6X7 例:辽B?6371A 尺寸:宽 45mm、高 90mm、间隔符宽10mm、

文档评论(0)

a888118a + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档