- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能 模式识别综述
模式识别综述摘 要模式识别(Pattern Recognition)又称图形识别,就是通过计算机用数学技术方法来研究模式的自动处理和判读。通常把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。本文主要阐述了模式识别的基本原理、方法及各种技术,以及在相关领域的应用。关键字:模式识别模式识别基本概念:(一)模式识别系统?模式识别的本质是根据模式的特征表达和模式类的划分方法,利用计算机将模式判属特定的类。因此,模式识别需要解决五个问题:模式的数字化表达、模式特性的选择、特征表达方法的确定、模式类的表达和判决方法的确定。一般地,模式识别系统由信息获取、预处理、特征提取和选择、分类判决等4部分组成,如图1-1所示。?分类器设计特征提取和选择预处理信息获取分类决策?图1-1?模式识别系统的组成框图(二)线性分类器?对一个判别函数来说,应该被确定的是两个内容:其一为方程的形式;其二为方程所带的系数。对于线性判别函数来说方程的形式是线性的,方程的维数为特征向量的维数,方程组的数量则决定于待判别对象的类数。对M类问题就应该有M个线性判别函数;对两类问题如果采用“+”“-”判别,则判别函数可以只有一个。既然方程组的数量、维数和形式已定,则对判别函数的设计就是确定函数的各系数,也就是线性方程的各权值。在计算机上确定各权值时采用的是“训练”或“学习”的方法,这就是待识别的模式集中挑选一批有代表的样本,它们经过人工判读成为已知类别的样本,把这批样本逐个输入到计算机的“训练”程序(或算法)中去,通过一次一次的迭代最后得到正确的线性判别函数,这样一个迭代的运算的过程成为训练过程。由于样本的分类首先经过人工判读,因而这样的构成分类器也称为有人监督或有教师的分类器。线性分类器虽然是最简单的分类器,但是在样本为某些分布情况时,线性判别函数可以成为最小错误率或最小风险意义下的最优分类器。而在一般情况下,线性分类器只能是次优分类器,但是因为它简单而且在很多情况下效果接近最优,所以应用比较广泛,在样本有限的情况下有时甚至能取得比复杂的分类器更好的效果。?(三)特征选择和提取(1)特征选择?????一个模式识别系统的成败,首先取决于所利用的特征是否较好地反映了将要研究的分类问题。因此如何设计和获取特征是一个实际模式识别的第一步。?特征的获取是依赖于具体的问题和相关专业的知识的,无法进行一般性的讨论。从模式识别角度,很多情况下人们面对的是已经得到的一组特征,或者是利用当时的技术手段把所有有可能观测到的特征都记录下来。这时,这些特征中可能有很多特征与要解决的分类问题关系并不密切,它们在后续的分类器设计中可能会影响分类器的性能。另一方面,有时即使很多特征都与分类器关系密切,但是特征过多会带来计算量大、推广能力差等问题,在这样数目有限时很多方法甚至会因为出现病态矩阵等问题而根本无法计算,因此人们也往往希望在保证分类效果的前提下用尽可能少的特征来完成分类。???模式识别中的特征选择的问题,就是指在模式识别中,用计算方法从一组给定的特征中选择一部分特征进行分类。这是降低特征空间维数的一种基本方法。(2)特征提取????原始特征的数量可能很大,或者说样本处于一个高维空间中,通过映射(或变换)的方法可以用低维空间来表示样本,这个过程称为特征提取。映射后的特征称为二次特征,它们是原始特征的某种组合(通常是线性组合)。所谓特征提取,在广义上就是指一种变换。若Y是测量空间,X是特征空间,则变换A:Y→X就称为特征提取器。一般情况下的特征变换都是将维变换。(3)特征选择和提取的作用???特征选择和特征的提取的主要目的,一是在不降低或者很少降低分类结果性能的情况下,降低特征空间的维数,二是为了消除特征之间可能存在的相关性,减少特征中与分类无关的信息,使新的特征更有利于分类。其主要作用在于:?(1)?简化计算。特征空间的维数越高,需占用的计算机资源就越多,设计和计算也就越复杂。(2)?简化特征空间结构。由于特征提取和选择是去除类间差别小的特征,保留类间差别大的特征,因此,在特征空间中,每类所占据的子空间结构可分离性更强,从而也简化了类间分界面形状的复杂度。(四)概率密度函数估计?概率密度函数的估计方法分为两大类:参数估计与非参数估计。?参数估计中,已知概率密度函数形式,但其中部分或者全部参数未知,概率密度函数的估计问题就是用样本来估计这些参
文档评论(0)