语言信息处理技术报告.doc

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语言信息处理技术报告

语言信息处理技术报告 指 导 教 师 黄河燕,鉴萍,史树敏 作 者 姓 名 王斌 王兴成 王阳 路翔 王勇 学 院 名 称 计算机学院 课 程 名 称 语言信息处理 日 期 2011年12月8日 摘要 随着计算机的普及,我们的生活变得日益信息化、智能化,各种计算机应用蓬勃发展。本文讨论的是其中的面向依存文法的句法分析技术。我们采用基于规则的方法进行翻译,研究使用依存文法束分析汉语并使用已有工具ctbparser实现了一个对汉语语法的分析。 现代依存语法理论的创立者是法国语言学家Tesnière。依存文法(dependency grammar)是一种用词之间的支配与被支配关系来描述语言结构的文法理论。Tesnière对人类语言进行广泛对比研究,侧重于研究语言的共性。其初衷是建立一门跨越各国语言界限、客观揭示人类语言内在规律的句法理论。因此,依存文法适合用来分析汉语句子。 汉语有自己的特殊性,汉语的词类和句法功能之间不存在直接映射。本文进行汉语语法分析的总体思路把分析分为两个部分:先给出词汇可能的句法功能,即依存标注(可能不唯一),然后再根据标注问的主从关系分析句子的句法结构。在进行句法分析时,主要依据是依存关系的五大公理。进行句法分析时采取寻找该依存标注的支配标注的方法:从句首到句尾进行分析,依次取词寻找其主词。 关键词:自然语言处理 依存文法 语法分析 汉语 Abstract With the widespread application of computer technology, Our modern life become more and more intelligent. In our article, we discuss the technology of dependency parsing analysis and how to accomplish a parser. We apply the rule-based method to translating. A French?linguist named Tesnière founded the modern theory of dependency grammar. This theory describes the language structure by the relationship of domination between words. His extensive comparative study of human language focuses on the commonness of language. His original purpose was to establish a language theory which across national boundaries and reveal the internal laws of human language objectively. Therefore, the dependency grammar is suitable for the analysis of Chinese sentences. Chinese language has its own specifics so there is no direct mapping between the Chinese part of speech and the syntax function. In the thesis,the main thought of the analysis of the Chinese syntax has two steps:first,we give the possible syntax functions(namely dependency label)of the word,then analyze the syntax structure of the sentence on the base of the dominant relations between the dependency labels. We label the word on the basis of the main characters of each part of the speech.We anal

您可能关注的文档

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档