弟十讲句法模式识别.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十讲 句法模式识别 基本概念 1、结构模式识别: 有一些模式识别任务,不能在特征空间中用统计模式识别的方法得到解决。 汉字的识别:汉字有偏旁部首、笔划构成 字符的识别:字符的字体不影响识别 语言的识别:语言由音节、字、词构成 图像识别:画面分割,目标识别 生物识别:基因序列,染色体结构,心电图分类 定义: 以结构基元为基础,利用模式的结构信息完成分类的过程,称为“结构模式识别”。 其中“基元”指构成模式结构信息的基本单元,本身不包含有意义的结构信息。 基元的选取与应用有关: 文字:笔划或偏旁部首作为基元 语音:音素作为基元 心电图:收缩波和扩张波作为基元 图形:边缘线段、角点都可作为基元 讨论: 结构模式识别是与统计模式识别完全不同的一大类模式识别问题,一个基于结构信息,一个基于特征值 结构模式识别不仅能完成分类,还可以得到每个模式的结构性质 结构模式识别的依据是模式间结构上的“相似性”,这种相似度的度量不能用一般特征空间中的距离来表示 结构模式识别可以采用句法方法、拓扑分析方法、图论方法等多种方法 基元提取和分类器训练上的困难使得结构模式识别方法仍未成熟 结构模式识别系统的模式信息通常来源于图像、音频等多媒体信息源 2、句法模式识别 (1)句法模式识别的定义: 句法模式识别是利用模式的结构信息,以形式语言理论为基础来进行结构模式识别的方法。 傅京荪(1930-1985) 美国工程院院士、Purdue大学讲座教授、台湾中央研究院院士,国际模式识别协会(International Association for Pattern Recognition:IAPR)60年代提出句法模式识别。 (2)句法和文法: 句法 句法来源于语言学,是指由字(词)构成句子的方式,也就是一个句子组成的规则。 句法具有递归性,可以重复组合使用,用简单的规则可以表达复杂的结构。 可以用句法来表达结构模式识别中基元间的结构关系。 文法 文法是指一类相似的句子的共同句法规则。 可以用文法来表示一类样本的共同特点。 对某个具体的句子进行句法分析,判别与某类的文法是否相似,可以实现模式识别。 (3)形式语言: 形式语言是自然语言的抽象,是用一组明确的数学规则描述的语言,是语言的“数学化”,它由按一定规律构成的句子或符号串的有限或无限的集合乔姆斯基(Noam Chomsky, 1928--)语言学家,語言学与哲学系荣誉退休教授,曾任该,并任该校认知科学研究中心主任1957年出版《句法结构》学者,并是有史以来被引用数第八多的学者。 3、句法模式识别系统的组成 句法分析: 判断一个样本是否符合一定的文法,从而得到该样本与已知类别的相似性。 文法推断: 从分好类的训练集中获得该类所有样本的共同特征,形成代表每个类别的文法规则。 利用形式语言理论完善和坚实的数学基础,可用句法分析的方法来实现结构模式识别问题的求解 形式语言理论 基本概念: (1)字母表: 与所研究的问题有关的符号集合。 例:V1={A,B,C,D}, V2={a,b,c,d},V3={0,2,6,8} (2)句子(链): 由字母表中的符号所组成的有限长度的符号串。 例如有字母表{0,1},则{0,1,00,01,0110}就是有效句子的集合。 不包括任何符号的句子称为空句,记为λ。 V*:由字母表V中的符号组成的所有句子的集合,包括空句子λ在内。 例: V*={λ,01, 001} V+:不包括空句子在内的句子集合,即V+=V*-(λ) (3)句子(链)的长度: 句子所包含的符号数目,例: |a3b3c3|=9 (4)语言: 由字母表中的符号组成的句子集合,用L表示。 例:字母表V={a,b} L1={ab,aab,abab} 有限语言 L2={anbm|n,m=0,1,2….}无限语言 在一种语言中,构成任何句子都必须遵循统一的规则,这些规则的集合称为文法,用G表示。L(G)表示由文法G构成的语言。 (5)文法 文法的数学定义:它是一个四元式,由四个参数构成: G={VN, VT, P, S} VT:终止符,不能再分割的最简基元的集合,用小写字母表示。 VT={a,b,c} VN:非终止符,由基元组成的子模式和句子的集合。用大写字母表示。VN={A,B,C} VT, VN的关系: VT∩VN= Φ(空集) VT∪ VN= V(全部字母表) S:起始符:属于VN非终止符中的一个符号 P:产生式(再写规则),存在于终止符和非终止符间的关系式。 例: α→β, α∈

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档