- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种自然语言理解中语法分析的算法设计和实现.pdf
· 8 · ComputerEraNo.10 2005
一 种自然语言理解中语法分析的算法设计和实现
马竹根
(长沙理工大学计算机与通信工程学院,湖南 长沙 410076)
摘 要:自然语言的理解是计算机研究的重要分支,主要体现在语法、语义和语音三方面。文章介绍了语法分析的各种方
法,剖析 了语言组成的结构关系,利用DELPHI语言编写了一种 自顶向下的语法分析程序,并通过具体的实例验证了算法
的正确性 。
关键词:自然语言;语法分析;文法;自顶向下
1引言 (2型语法);正则语法(3型语法)。一些表达相同意义的句子尽管
自然语言是人类使用的各种语言,是人类交流和学习的重 表层结构不同,但其深层结构却是相同的。转换生成语法的原
要工具,是文明的象征。目前世界上使用的语言主要有英语 、法 理是,通过上下文无关语法生成句子的深层结构,然后应用转换
语 、拉丁语 、汉语和 日语等,不同的语言发音 、词汇和语法均不 规则再将深层结构转换为表层结构。如果要进行句子分析,则
一 样。但不论是何种语言,对自然语言的研究主要集中在语言 首先要逆向应用转换规则将表层结构转换为深层结构,之后再
的三个要素上 ,即语法、语义和语音,语法分析词汇组成的各种 应用上下文无关文法进行分析。在 NChomsky的语法中基本上
规则,语义分析语言表达含义和歧义性,语音分析语言的发音 完全抛开了语义、语用和语境(广义)方面的知识 ,只局限在一个
规律和声音技术。由于语言词汇数量的庞大、语法规则的复杂 形式化的机制上,因此较难完整确切地描述 自然语言。
性、语义的二义性和语音的模糊性 ,只有利用计算机技术来分 2.2扩展转换网络
析和研究这些问题才有利于提高对语言的处理和识别能力,使 1970年美国Woods(伍兹)根据NChomsky(乔姆斯基)创
能处理 自然语言的机器成为具有人类智能的机器。计算机 目前 建的转换生成语法 ,设计了扩展转换网络(AugmentedTransi-
主要能处理计算机语言编写的特定规则的命令,若能分析自然 tionNetwork,简称ATN),并于1972年建成了LUNAR模型。扩
语言的语法规则,并转换成计算机高级语言编写的指令 ,则计 展转换网络既可以看成是一种语法描述工具,亦可以看成是一
算机能容易地处理 自然语言。本文主要分析自然语言的语法问 种自动机。在ATN中文法被表示为一组图(或称为网),这些网
题,并通过实际的编程语言来完成对自然语言的语法分析。 表示了句子成分的可能顺序以及在处理过程中分析器可能进
2 自然语言语法分析的主要方法 行的各种选择。LUNAR是把 ATN语法应用于实际问题的一个
2.1转换生成语法 范例 ,由于系统只要求有限的性能 目标,所以自然语言对话中
1957年美国NChomsky(乔姆斯基)创建了转换生成语法 的某些常见的复杂问题被回避了。但通过扩充网络中的语法规
(TransformationGenerativeGrammar),NChomsky用数字方法 则,则能较好地完成语法分析工作。
定义人工语言(形式语言)来研究语言学问题 ,用他的语言生成 2.3语义网络
方法去研究形式语言。NChomsky将句子的结构分为深层结构 1996年美国Quillian(奎廉)首次提出了一种知识表示工
和表层结构两个层次,并将语法划分为四个型:无约束短语结 具——语义网络SN(SemanticNetwork),Quillian建议用语义网
构语法(0型语法);上下文有关语法(1型语法);上下文无关语法 络来描述人对事物的认识,实际上是对人脑功能的模拟,并希望
21th InternationalConference on Information Systems.2000 reo
文档评论(0)