- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别演示第3章
第三章 句法模式分析 一. 形式语言基本概念 二. 模式的文法表示方法 三. 用句法分析作模式识别 引言 用各种语言学的结构方法来解决模式识别问题。 例如,对句子“我读这本书”进行句法分析,这里的“我”是主语,“读”是谓语,“这本书”是词组,其中“这本”是定语,“书”是宾语。 把一个模式分解为较简单的子模式,再分解为最简单的子模式(称为基本元素或“基元”)。 如图21所示,把模式、子模式、基元分别对应于句子、词组和单字,并将基元进行组合和相互关联所必须遵守的规律,对应于语言的文法(句法)。 一. 形式语言基本概念 句法模式识别的数学基础是形式语言,下面先介绍一些形式语言的基本概念。 (P54) 二. 模式的文法表示方法 把一个复杂的模式,分解为基元,再根据其间的关系(文法律),相互组合以构成模式,称为模式的文法(结构)表示方法。 在统计模式识别中,一个模式是用N维特征向量表示的。 在句法模式识别中,模式是用一个句子表示,这个句子可以是符号串(链),也可以是“树”或“图”。 下面分别介绍。 (一) 链表示法(串文法) 把一个模式或图形用一串链码表示,称为链表示法。 其具体方法很多..(1)最简单的方法是将任意曲线用等长的线段(基元)来表示。其中一种方法是选定顺序相差45°方位角的八个等长直线作为基元(见图23,a), 或者,(2)选定三个方向基元,p表示10°到90°方向,n表示 -10°到 -90°方向以及z表示 -10°到10°方向(图23,b)。 见下页图 (二) 树表示法(树文法) 串文法是一维的串,每个符号只与左右两边的符号联接。 二维的关系要用“树”来表示。树文法的特点是它的文法律P的代换式的右侧可以是一个“树”。 树文法被定义为五元组: Gi = (VN,VT, r, P,S) (P57) (三) 图表示法(图文法) 对于多维的图形(如立体图,汉字等), 可以从树文法扩展,用树的结点表示中间模式元,各结点之间用边来表示它们之间的关系。也就是说,文法律P的代换式右边不单是树,而且还标明各树杈(树叶)之间的关系,例如左、右、前、后的关系,由此构成关系树图。所以图文法也称关系树图文法。 图文法也包含VN 、VT 、P 、S ,另外还加上关系标志,以确定子图之间的边的连接关系。例如:关系标志={上,下,左,右,前,后}。 例12.今举一汉字的图文法表示。 G={VN ,VT ,P ,S ,关系标志} VT={木,门,一,口,扌,人,刀,忄} VN={同,困,合,,S} 关系标志={上,下,左,右,里,外} (P59) 试问“捆”字是否属于给定的字集中的字。 (四) 随机文法 当样本受到噪声干扰,使图形有可能畸变(例如同一字码的不同手写体),这时,在执行某一条代换式时,要加上一个执行概率p(代换概率),使代换式变成随机代换式,形如: P: ??? 由此产生的文法称为随机文法GS ,由GS产生的句子集合称为随机语言,可表示为 L(GS)={(X,p(X))|X VT*,S?X, I=1,…k} 三. 用句法分析作模式识别 模式识别是要判定被识样本X是否属于某个模式类 。统计模式识别过程和句法模式识别过程可以对比如下: 统计分类:样本X→特征向量→统计量→准则gi(X)→判决X? gi(X),X ? ?i 句法分类:样本X→句子→文法G→语言L(Gi)→判决X ? L(Gi),X ? ?i (一)自动机技术 具体的句法分析分类方法有多种,这里介绍两类对串文法的基本分类方法。 如图30所示,由输入带、读入头和控制器组成硬件模型,对不同文法,设计不同的控制器。被识样本X=a1a2…an记录在输入带上,由控制器控制输入带运动,自左至右,读入头每读入一个符号,便由控制器根据状态规则(例如P的代换式)来判断能否接受该符号。若所有的符号都能接受,说明该句子是属于该自动机所能接受的某种语言,于是判定属于某类。这就是句法模式识别的自动机技术。 有限自动机 自动机中最简单一种是确定的有限自动机,它是模拟多种离散自动系统的一种数学模型。它被定义为: A=(Q,?,?,q0,F) 其中:Q为一非空有限集,称为A的内部状态集,表示成: Q={qi| i =0,1,…,m) ?为一非空有限集,称为A的输入字母表,表示成: ? = {ai|i=1,2,….,n} ?:Q???Q,为内部状态的映射.笛卡尔乘积. q0为自动机的初始状态. F为终止状态集.
文档评论(0)