- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6.4.3 扩展树文法的推断 第三步:合并等价非终止符,删除被合并的非终止符的所有 后代生成式。 例6.8 设某类句法模式树描述的样本集中含有树T1和T2: 解:第一步:分别写出产生树T1和T2的生成式。 产生树T1的生成式: 增加一个,得到产生树T2的生成式: 6.5 句法分析 6.5.1 参考链匹配法 利用文法对未知类别的句法模式进行识别或分类的过程。 句法分析: * 对每一类模式给出一组样本链(参考链)。 设有M类模式。 * 将输入链x与每一类的参考链进行比较,并规定一个比较容 限。 x被识别为与其匹配“最好”的参考链所属的模式类。 6.5.2 填充树图法 用于上下文无关文法的分析。 若已知某语言的文法Gi,给定某待识别的链x,建立一个以x 为底,以起始符S为顶的三角形,如图6.8所示。 用文法Gi的生成式填充这个三角形,使之成为一个分析树。 若填充成功,表示x可以由文法Gi导出, 图6.8 待填充的三角形 填充三角形的方法: 顶下法 底上法 解:填充三角形成功, 图6.9 用文法G的生成式填充的三角形 6.5.3 CYK分析法 库克(Cocke) -杨格(Younger) -卡塞米(Kasami)分析法 用于上下文无关文法的分析 1.乔姆斯基范式 要求:生成式必须表示为乔姆斯基范式。 或 其中A,B,C为非终止符,a为终止符。 例如, 乔姆斯基范式为 2.CYK分析法 输入:乔姆斯基范式的上下文无关文法G、输入链x; 输出:关于链x的分析表。 关键:构造x的分析表 方法: 步骤: 第五步:停机,填表结束。 6.5.4 厄利分析法 一种有效的上下文无关文法的分析算法。 圆点:分割开经分析后符合的部分和尚未考虑的部分。 思路: 步骤: 反复执行2和3,到没有新项目加入I0为止。 反复执行5和6,到没有项目加到Ij中为止。 解: 6.6 句法结构的自动机识别 自动机:句法模式识别器。 识别输入链是否符合与该机相对应的文法。 0型文法 图灵机 1型文法 线性有界自动机 2型文法 下推自动机 3型文法 有限态自动机 每类文法对应一类自动机: 链文法: 树文法 树自动机。 其他: 1.有限态自动机 6.6.1 有限态自动机与正则文法 输入字母表 内部状态 有限集 状态转换规则 初始状态 终止状态集 自动机每次从一个状态只能转换到另一个指定的状态。 确定的有限态自动机: 非确定的有限态自动机: 自动机每次从一个状态可以转换到一个指定状态集中 的任意一状态。如: 中华民族有着五千多年的文明历史,中华民族在世界上是一个非常卓越和伟大的民族。我们有过繁荣昌盛的唐朝,有过强盛无比疆域辽阔的汉朝和元朝,更有灿烂美丽的唐、宋文化 6.1 句法模式识别概述 6.2 形式语言的基本概念 6.3 模式的描述方法 6.4 文法推断 6.5 句法分析 6.6 句法结构的自动机识别 第6章 句法模式识别 6.1 句法模式识别概述 模式用句子形式描述,结构信息十分重要。 模式 子模式 基元 句子 词组 单词 组合关系 自然语言的文法 句法模式识别用小而简单的基元与语法规则描述和识别 大而复杂的模式,通过对基元的识别,进而识别子模式,最终识别复杂模式。 符合某个文法的所有句子的集合 一个模式类 (b) 墙壁 f 地板 g E D B b a d c e (c) 图6.1 景物结构描述 与英文句子句法描述的对比 句法模式识别系统的组成: 句法模式识别的理论基础:形式语言 20世纪50年代中期乔姆斯基(Chomsky)。 * 基元选择尚无通用的方法; * 文法推断理论远不及统计学习发展得成熟。 句法模式识别存在的主要问题: 6.2 形式语言的基本概念 6.2.1 基本定义 1.字母表 与问题有关的符号的有限集合,用V或∑表示。 2.句子 由字母表中符号组成的有限长度的符号串,又称链。空句 用λ表示。 组成:英文小写字母、数字。 例:由 中元素可组成句子: 例: abc,aacc,… 重写次数 句子的长度:句子包含符号的数目,用|?|表示。 3.语言 由字母表中的符号根据某种文法组成的句子的集合。 V *:V中符号组成的所有句子的集合,包括空句; V +:不包含空句的句子集合。 例: 4.文法 构成一种语言的句子所必须遵守的规则。 VN :非终止符的有限集,子模式的集合,大写字母表示。 VT :终止符有限集,基元的集合,字母表起始部分的小写
您可能关注的文档
最近下载
- 2025年危险品水路运输从业资格考试复习题库资料(浓缩500题).pdf
- 标准图集-苏S13-2022 预制混凝土排水检查井.pdf VIP
- T/CSWSL 036-2024N-酰基高丝氨酸内酯酶.pdf
- 2025至2030中国宫颈癌疫苗行业市场占有率及投资前景评估规划报告.docx VIP
- 2025至2030汽车防爆膜行业市场占有率及投资前景评估规划报告.docx VIP
- 2025至2030热熔线标涂料行业市场发展分析及投资前景报告.docx VIP
- 2021年禁毒社工招聘考试试题.doc VIP
- 医院病理技师礼仪与病理诊断.pptx VIP
- 2021年度禁毒社工招聘考试试题.doc VIP
- 《十二公民》剧本.docx VIP
文档评论(0)