- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别论文
息对模式进行分类或者对模式进行分析(描述)。分类是实现一个模式与一个类别号的对应。分析(描述,解释)则是实现一个模式与一个符号描述的对应。模式分析一般包括:解释模式的组成部份,说明各个组成部份的时间和空间关系,甚至给出作出特定解释的理由。
1、 用统计方法发展起来的模式识别系统如图一所示。
图一 统计模式识别系统
在用统计方法研究模式识别问题时,大体上侧重于特征抽取与选择以及模式分类与学习两个方面。
(一)特征选择与特征抽取
特征选择与特征抽取的一般方法主要分为两种:特征空间变换以及信息和距离的测度。特征空间变换这个方法目的是将原始特征空间变换为较低维数的特征空间,以便于模式的表示与模式的分类。为了压缩特征空间的维数常利用Karhunen-love展开式和主分量分析法。衡量变换结果好坏的标准之一是要看是否增加模式类的可分性。就增加模式类的可分性而言,一般非线性变换比线性变换好。然而就计算复杂性而言,。线性变换要比非线性变换简单得多。
(二)分类和学习
对模式进行分类和描述是模式识别系统的根本目标。对于每类模式,当已经知道或者虽不确切知道但能精确估计出其特征向量的条件概率密度函数时(亦称类密度函数),就可以导出贝叶斯分类规则,它使平均风险或误识率最小。实际上,当可以得到大量模式样本时,可以比较精确的估计出类密度函数,或者从样本学习到类密度函数。比较实用的非参数分类方案有:最近邻分类规则(NN规则)和K最近邻分类规则(K-NN规则,以及其他种种变态的NN规则。非参数分类方案一般是从样本中直接学习分类规则。
对于无人管理的学习,特别是模式的类射数不确切知道时,这时的分类就是集群分析。各种相似性和距离测度都可用作集群划分的准则。集群划分准则和集群参数的选择往往需要探索性地或交互式地进行。
2、 运用句法(或结构)方法的模式识别系统的框图如图二所示。
图二 句法模式识别系统
图中的“基元”类似于统计方法中的特征。在句法方法中。用一个“句子”表示一个模式。句子构成语言语言具有特定的文法。
(一)基元选择和基元抽取
通常需在基元抽取的复杂性和文法复杂性两者之间折衷,也可以用曲线线段的长度和曲率等表示曲线线段的特征。对于区域范围的模式,一个区域内存在两个特征互异的子区域时称这个区域为边缘,存在着小于一定距离的两个边缘时称这个区域为线,边缘闭合时称为区。常用的特征可以取灰度特征。也可以用形状和纹理测度来描述区域。其他还有一些方法亦可用来描述图像基元,例如灰度矩阵、灰度共生矩阵、梯度共生矩阵、点测度等。
(二)文法
文法就是用基元构成模式的规则。文法推断是一个总结由基元构成模式的规律性。从而得到规则即文法的过程,类似于学习。已经有了各种专门的语言来描述特定的模式。例如描述中外文字字符、染色体图像、火花室图像、二维数学化学结构、颈动脉脉冲波形、二维飞机外形、口语单词、指纹图像等。对于多维模式,用多维文法来描述。其他如网状文法(web)、图文法、树文法、形状文法等都已有了应用。有两个因素决定了文法的选择,一个是所选基元的情况,另一个是要权衡文法的描述能力与文法分析的效率。
在实际应用中,往往存在某些不确定性。例如测量中的噪声和抖动会引起分割误差和基元抽取误差,从而使描述模式的语言产生二义性。在二义性存在的情况下,可以用随机语言来描述模式。产生随机语言的文法称作随机文法。在随机文法中引进了概串方法,即用具有概率分布的语句来描述模式。
(三)句法分析
句法分析则是分析输入模式是否符合某种文法规则的过程。也就是分析能否用该文法生成输入模式。分析结果为肯定则对输入模式完成了分类。分析结果为否定,则拒绝输入模式。在选择文法时需考虑文法的描述能力与句法分析复杂性之间的矛盾。同样,在研究句法分析问题时,也应考虑如何从句法分析的角度处理这种矛盾。事实上,要在提高纠错能力和降低分析效率之间进行权衡,实际困难较大。
在句法分析中,还可以采用距离或加权距离的方法。这也是一种无人管理的方法。完成集群分析以后,就可以应用文法推断技术来推断每一个群的文法,并构造出相应的句法分析器。
= 3 \* CHINESENUM3 三 、模式识别的应用
模式识别可用于文字和语音识别、遥感和医学诊断等方面。
(一)文字识别
字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。
汉字是历史悠久的中华民族文化的重要结晶,其数量之大,构思之精,为世界文明史所仅有。由于汉字为非字母
文档评论(0)