词组型术语结构的自动句法剖析.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
载《中国科技术语》,2009 年,第 5 期,Vol.11,No.5 词组型术语结构的自动句法剖析 冯志伟 (教育部语言文字应用研究所) 摘要:本文根据计算术语学的原理,使用短语结构语法对词组型术语进行了自动句法分析。通过具体 的实例,介绍了两种基于短语结构语法的剖析方法-- 自底向上剖析和自顶向下剖析。 关键词:计算术语学,短语结构语法,自动句法剖析,自底向上剖析,自顶向下剖析 中图分类号:N04; H085.2, 文献标识码:A,文章编号:1673-8578(2009)05-0010-07 Automatic syntactic parsing of phrase-term structure FENG Zhiwei Abstract: Based on fundamental principle of computational terminology, the phrase-terms are syntactically parsed by the Phrase Structure Grammar (PSG). In this paper, through the concrete examples, the author introduces two kind of parsing approaches: bottom-up parsing and top-down parsing. Key words: computational terminology, Phrase Structure Grammar (PSG), automatic syntactic parsing, bottom-up parsing, top-down parsing. 我们在《单词型术语的自动分析》1一文中,讨论了单词型术语的自动分析问题。在一 个术语系统中,词组型术语的数量比单词型术语的数量多得多。因此,在计算术语学 (computational terminology )中,除了研究单词型术语的自动分析之外,还有必要研究词组 型术语的自动分析问题。词组型术语是由若干个句法单位构成的,是有结构的。词组型术语 的自动分析就是计算机自动地识别词组型术语的各个句法单位以及它们之间的相互关系的 2 过程,这个过程,又叫做“自动句法剖析”(automatic syntactic parsing ) 。 词组型术语的剖析技术是建立在自然语言的形式语法的基础之上的。所谓“剖析” (parsing ),就是要用形式语法(formal grammar )来分析词组型术语的结构,使之能清晰地、 形式化地表示出来,因此,形式语法在词组型术语的剖析中有着极为重要的作用。 一般地说,一种好的形式语法,在语言的描述方面应该尽量地自然、明白、易懂,在数 学的表达方面,应该有很强的说明力和解释力,在计算技术方面,应该具有较高的效率。 美国语言学家乔姆斯基(N. Chomsky )提出,形式语法G 可以用下面的四元组来定义: 1 冯志伟,单词型术语结构的自动分析,《中国科技术语》,2009 年,第 2 期。 2 冯志伟,一种无回溯的自然语言分析算法,《语言文字应用》,2002 年。 G = (Vn, Vt, S, P) 其中,Vn 是非终极符号的集合,这些符号是专门用来描述语法类别的,它们是范畴符 号,如词类符号、词组类型符号等;Vt 是终极符号的集合,它们就是被定义语言中的具体 的单词;S 是初始符号,它是集合 Vn 中的一个特殊成员;P 是重写规则的集合,其中的每 一条规则都具有 φ→ψ 的形式,φ称为规则的左部(Left Hand Side ,简称 LHS ),ψ称为规则的右部(Right Hand Side , 简称 RHS ),φ→ψ意味着可以用规则的右部φ来置换规则的左部ψ。 给定了一个语法 G,我们就可以从初始符号 S 开始,应用重写规则推导出这种语法 G 所描述的语言 L(G). 具体地说,我们可以用重写规则

文档评论(0)

chqs52 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档