(完整版)自然语言处理.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自然语言处理技术课程总结 自然语言信息处理技术产生于上个世纪 40 年代末期,它是通过采用计算机技术来对自然语言进行加工处理的一项技术。 该技术主要是为了方便人与计算机之间的交流而产生的。 由于计算机严密规范的逻辑特性与自然语言的灵活多变使得自然语言处理技术较复杂。通过多年的发展,该项技术已取得了巨大的进步。 其处理过程可归纳为:语言形式化描述、处理算法设计、处理算法实现和评估。 其中,语言形式化描述就是通过对自然语言自身规律进行研究, 进而采用数学的方法将其描述出来,以便于计算机处理,也可认为是对自然语言进行数学建模。 处理的算法设计就是将数学形式化描述的语言变换为计算机可操作、控制的对 象。处理算法实现和评估就是通过程序设计语言(如 C语言)将算法实现出来, 并对其性能和功能进行评估。它主要涉及到计算机技术、数学(主要是建模) 、统计学、语言学等多个方面。 自然语言处理技术是所有与自然语言的计算机处理有关的技术的统称, 其目 的是使计算机理解和接受人类用自然语言输入的指令, 完成从一种语言到另一种语言的翻译功能。 自然语言处理技术的研究, 可以丰富计算机知识处理的研究内容,推动人工智能技术的发展。 下面我们就来了解和分析自然语言处理的关键技术。 一、 常用技术分类 1、 模式匹配技术 模式匹配技术主要是计算机将输入的语言内容与其内已设定的单词模式与 输入表达式之间的相匹配的技术。 例如计算机的辅导答疑系统, 当用户输入的问题在计算机的答疑库里找到相匹配的答案时, 就会完成自动回答问题的功能。 但是不能总是保证用户输入的问题能得到相应的回答, 于是很快这种简单匹配式答疑系统有了改进。 答疑库中增加了同义词和反义词, 当用户输入关键词的同义词或反义词时, 计算机同样能完成答疑, 这种改进后的系统被称为模糊匹配式答疑系统。 2、 语法驱动的分析技术 语法驱动的分析技术是指通过语法规则, 如词形词性、 句子成分等规则, 将输入的自然语言转化为相应的语法结构的一种技术。 这种分析技术可分为上下文 无关文法、转换文法、 ATN文法。上下文无关文法是最简单并且应用最为广泛的语法,其规则产生的语法分析树可以翻译大多数自然语言, 但由于其处理的词句无关上下文, 所以对于某些自然语言的分析是不合适的。 转换文法克服了上下文无关文法中存在的一些缺点, 其能够利用转换规则重新安排分析树的结构, 即能 形成句子的表层结构, 又能分析句子的深层结构。 但其具有较大的不确定性。 ATN 文法扩充了转移网络, 比其他语法加入了测试集合和寄存器, 它比转移文法更能 准确地分析输入的自然语言,但也具有复杂性、脆弱性、低效性等缺点。 3、 语义文法 语义文法的分析原理与语法驱动相似, 但其具有更大的优越性。 语义文法中是对句子的语法和语义的共同分析, 能够解决语法驱动分析中单一对语法分析带 来的不足。 它能够根据句子的语义, 将输入的自然语言更通顺地表达出来, 除去一些语法正确但不合语义的翻译。 但是语义文法分析仍然有不容忽视的缺点, 其分析的语句中有时会出现不合语法的现象, 并且这类分析较为复杂, 语义类难以确定,语义的规则太多??因此,语义文法技术仍需要改进措施。 4、 格框架约束分析技术 格框架是由一个头部和一组辅助概念组成的。头部一般是由主要动词构成, 辅助概念也称“域”,以某种规范形式与头部相连。格框架定义规定了与头部相 应的必有格、 随意格和禁止格。 在进行格框架约束分析技术时, 输入的自然语言被转化为格内容, 它既结合了语法驱动分析技术和语义文法分析技术的优点, 又能够克服语义文法中不合文法的现象, 解决语句的多义性问题。 是计算机语言研究中的重大发展之一。 5、 系统文法 系统文法是从多个层次分析自然语言的分析方法,它强调句子的整体结构。 其主要是从语法、 语义和语音等层次来分析自然语言。 每一层次又有三种不同的分析,分别为功用说明、 特征说明和组成成分结构分析。 系统文法可以根据自然语言的功能特性和组成成分来分析自然语言,但也有系统结构复杂等缺点。 6、 功能文法 功能文法是对句子的完全功能描述, 它描述了自然语言的特征组合、 功能分配、词语组成成分顺序,是一种既可以用于分析,也可以用于生成的文法。功能 文法的分析形式是分析自然语言的主动句规则、 主谓一致规则, 构成相应的字典入口形式。有一种与功能文法相似的文法系统为词功能文法, 它则更强调词典的功能。 7、 故事文法 故事文法的研究则显示计算机翻译输入的自然语言时,不仅仅从语句的语 法、语义、结构的角度, 还能够从整个故事的情节发展的角度将信息整合得准确到位。但此类文法一般只适用于处理较为简单的,文体较为形式化的故事描述, 对于一些情节较为复杂的故事, 则不一定能够精确描

文档评论(0)

冬天一把火 + 关注
实名认证
文档贡献者

夏天的一块冰

1亿VIP精品文档

相关文档