- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
4、扩充转移网络(1)有限状态转移网络以冠词“The”开头的一类名词短语NP的转移网络,它可以拥有零个或多个形容词;最后以一个名词结尾。组成:一组状态(或称结点)和一组弧组成。例子:输入“theprettypicture”。从起始状态NP开始,只有一条标注着“the”的外射弧。由于输入串中的the能同它匹配,所以“the”从输入串中删除,过程进入图中的状态NP1。此时输入串是“prettypicture”,由于第一个“pretty”的词类是ADJ,同标注ADJ的弧匹配,于是“pretty”从输入串中删除,但沿着ADJ弧转移的结果是再次回到这个NP1状态。此时输入串只剩下“picture”,由于它是一个名词,因此发生了沿N弧前进到结束状态的转移。输入串成为空串,分析成功。*这个句子的识别还可以在网络中走其它弧,如由状态c输入“swallow”也可以走弧c→d,但接下来输入“flies”时就被拒绝识别了。由此可看出网络识别的过程应找出各种可能的路径,因此算法要采用并行算法或回溯算法。并行算法。并行算法的关键是在任何一个状态都要选择所有可以到达下一个状态的弧,同时进行试验。回溯算法。回溯算法则是在所有可以通过的弧中选出一条往下走,并保留其他可能性,以便必要时可以回过来选择之。这种方式需要一个堆栈结构。(2)递归转移网络(RTN)是对有限转移网络的一种扩展,在RTN中每条弧的标注不仅可以是一个终结符(词或词类),而且可以是一个用来指明另一个网络名字的非终结符。例如,下面是一部上下文无关语法:S→NPVNPPP*NP→TADJ*NPP*PP→PNPX*表示符号X可以出现零次或多次。(3)扩充转移网络(ATN)ATN语法属于一种增强型的上下文无关语法,即用上下文无关文法描述句子文法结构,并同时提供有效的方式将各种理解语句所需要的知识加到分析系统中,以增强分析功能,从而使得应用ATN的句法分析程序具有分析上下文有关语言的能力。ATN主要是对转移网络中的弧附加了过程而得到的。当通过一个弧的时候,附加在该弧上的过程就会被执行。这些过程的主要功能是(I)对文法特征进行赋值;(II)检查数(number)或人称(第一、二或三人称)条件是否满足,并据此允许或不允许转移。ATN在三方面对RTN作了扩展和增强:添置了一组寄存器,用来存储分析过程中得到的中间结果和有关信息。例如,“小王研究鲁迅的文章”可能先被分析为NP+VP,但发现后面的词是“发表”,则要回到前面的某个转移点重新分析,选择另一条路。每条弧上除了用句法范畴来标注以外,可以附加任意测试,只有当弧上的这种测试成功之后才能用这条弧。每条弧上还可以附加某些动作,当通过一条弧时,相应的动作便被依次执行,这些动作主要用来设置或修改寄存器的内容。例:一个简单的名词短语(NP)的扩充转移网络,网络中弧上的条件和操作如下所示:该网络主要是用来检查NP中的数的一致值问题。特征是Number(数),有两个值:singular(单数)和plural(复数),缺省值是?(空)。C是弧上的条件,A是弧上的操作,*是当前词,proper是专用名词,det是限定词,PP是介词短语,*.Number是当前词的“数”。该扩充转移网络有一个网络名NP。网络NP可以是其他网络的一个子网络,也可以包含其他网络,如其中的PP就是一个子网络,这就是网络的递归性。弧NP-1将当前词的Number放入当前NP的Number中;而弧NP-4则要求当前noun的Number与NP的Number是相同时,或者NP的Number为空时,将noun作为NP的Number,这就要求det的数和noun的数是一致的。因此thisbook,thebook,thebooks,thesebooks都可顺利通过这一网络,但是thisbooks,或thesebook就无法通过。如果当前NP是一个代词(pron.)或者专用名词(proper),那么网络就从NP-5或NP-6通过,这时NP的数就是代词或专用名词的数。PP是一个修饰前面名词的介词短语,一旦到达PP弧就马上转入子网络PP.例:一个句子的ATN,主要用来识别主、被动态的句子。S网络中所涉及的功能名和特征维包括:功能名:Subject(主语),Direct-Obj(直接宾语),Main-Verb(谓语动词),Auxs.(助动词),Modifiers(修饰语)。特征维:Voice(语态):Active(主动态),Passive(被动态),缺省值是Active。Type(动词类型):Be,Do,Have,Modal,Non-Aux,缺省值是Non-A
您可能关注的文档
最近下载
- 年产3万吨黄桃罐头工厂设计.docx
- 浅谈政务信息化项目全过程咨询管理.pdf VIP
- [临沂]2024年山东临沂市直部分医疗卫生事业单位招聘笔试典型考题与考点研判含答案详解.docx
- 2022-2023学年人教版二年级数学下册第九单元 数学广角——推理测试卷含答案.docx
- 年产一万吨黄桃罐头工厂设计.docx VIP
- 2024年水泥质量与检验题库——简答题(二).docx
- 2025年云南省高等职业技术院校分类考试思想政治模拟卷(A4).doc VIP
- 钒钛磁铁矿冶炼渣选铁工艺及设备.docx VIP
- 新疆大学《计算机网络》2019-2020学年期末试卷.pdf VIP
- 水泥质量与检验题库--简答题(含答案).docx VIP
文档评论(0)