- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别基础电子教案V002
模式识别基础
李红军
1 产生与发展
模式识别(Pattern Recognition)诞生于20世纪20年代,随着40年代计算机的出现,50年代人工智能的兴起,模式识别在60年代初发展成一门学科.
它是人工智能(Artificial Intelligence)系统的不可缺的组成部分
模式识别简史
1929年 G. Tauschek发明阅读机 ,能够阅读0-9的数字。
30年代 Fisher提出统计分类理论,奠定了统计模式识别的基础。
50年代 Noam Chemsky 提出形式语言理论——傅京荪 提出句法结构模式识别。
60年代 L.A.Zadeh提出了模糊集理论,模糊模式识别方法得以发展和应用。
80年代以Hopfield网、BP网为代表的神经网络模型导致人工神经元网络复活,并在模式识别得到较广泛的应用。
90年代小样本学习理论,支持向量机也受到了很大的重视。
2 什么是模式和模式识别?
广义地说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可以称之为模式;
狭义地说,模式是通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息;把模式所属的类别或同一类中模式的总体称为模式类(或简称为类)。而“模式识别”则是在某些一定量度或观测基础上把待识别的模式划分到各自的模式类中去
3 模式识别的方法
传统的模式识别方法有:
(1)统计模式识别:随机数组或随机向量,在多维空间中表示一个点.分类问题把几何空间划分成某些子空间,同一子空间内的点作为一类.
(2)结构(句法)模式识别: 利用模式与子模式分层结构的树状信息所完成的模式识别工作,就是结构模式识别或句法模式识别。
新发展的两种模式识别方法:
(3) 模糊模式识别
(4)人工神经网络模式识别
4 模式识别的应用
天气预报
卫星航空图片解释
工业产品检测
字符识别
语音识别
指纹识别
医学图像分析
5 距离的定义
1-范数距
2-范数距离(欧氏距离)
3 其他距离的定义
6 文本识别
1966 IBM公司的Casey和Nagy首次发表汉字识别文章
概念与记号
建立字母表∑,
字符串s:由字母表中的字符组成的有限的序列;
字符串的长度:
子字符串:
∑n:长度为n的所有有限字符串的集合;
所有字符串:
模式识别效果评价
误识率 ; 信息熵
7图像识别
图像的存储与读取
165
158
139
136
176
170
155
146
171
167
164
164
153
155
157
156
300×300
(200:204) ×(200:204)
图像的预处理方法
几何操作、 邻域和区域操作、
图像变换、 图像恢复与增强、
线性滤波和滤波器设计、 变换(DCT变换等)、
图像分析和统计、 二值图像操作
应用
字符识别 汉字的识别
模式识别过程实例
在传送带上用光学传感器件对鱼按品种分类
鲈鱼(Seabass)
品种
鲑鱼(Salmon)
识别过程
数据获取:架设一个摄像机,采集一些样本图像,获取样本数据
预处理:去噪声,用一个分割操作把鱼和鱼之间以及鱼和背景之间分开
识别过程
特征提取和选择:对单个鱼的信息进行特征选择,从而通过测量某些特征来减少信息量
长度
亮度
宽度
鱼翅的数量和形状
嘴的位置,等等 …
分类决策:把特征送入决策分类器
模式分类器的获取和评测过程
数据采集
特征选取
模型选择
训练和测试
计算结果和复杂度分析,反馈
训练和测试
训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。
测试集:在设计识别和分类系统时没有用过的独立样本集。
系统评价原则:为了更好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测试集对系统进行测试。
实例:统计模式识别
19名男女同学进行体检,测量了身高和体重,但事后发现其中有4人忘记填写性别,试问(在最小错误的条件下)这4人是男是女?体检数值如下:
实例:统计模式识别(续)
待识别的模式:性别(男或女)
测量的特征:身高和体重
训练样本:15名已知性别的样本特征
目标:希望借助于训练样本的特征建立判别函数(即数学模型)
实例:统计模式识别(续)
由训练样本得到的特征空间分布图
实例:统计模式识别(续)
从图中训练样本的分布情况,找出男、女两类特征各自的聚类特点,从而求取一个判别函数(直线或曲线)。
只要给出待分类的模式特征的数值,看它在特征平面上落在判别函数的哪一侧,就可以判别是男还是女了。
无监督分类
最近距离法
最远距离法
文档评论(0)