单词型术语结构自动分析.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
载《中国科技术语》,2009年,第3期,Vol.11,No.3 单词型术语的结构自动分析 冯志伟 摘要:本文根据计算术语学的原理,使用有限状态转移网络对单词型术语进行自动分析。首先以英语术语 为例,介绍了有限状态转移网络的基本原理和分析过程,然后,分别讨论了德语、法语和汉语的单词型术 语的自动分析问题,最后讨论了分析结果的形式表示方法。 关键词:计算术语学,有限状态转移网络,自动词法分析, Automatic analysis of single-word term structure FENG Zhiwei Abstract: Based on fundamental principle of computational terminology, the author automatically analyzes the single-word terms by the Finite State Transition Network (FSTN). In this paper, the basic principles and analysis process of FSTN are introduced in examples of English terms, then the automatic analysis of German, French and Chinese single-word terms are discussed, lastly the formal expression of analysis result is also discussed. Key words: computational terminology, Finite State Transition Network (FSTN), automatic morphological analysis. 1998 年的计算语言学国际会议 COLING-ACL’98 上,组织了世界上第一次计算术语学的 讨论会(First Workshop on Computational Terminology),这次讨论会首次使用的“计 算术语学”这个学科名称。从此在术语学的研究中,明确地引进了自然语言处理(Natural Language Processing,简称 NLP)的方法和技术,出现了“计算术语学”① (computational terminology)这样的学科。 冯志伟在 1997 年的术语学与知识转播国际会议上发表的《日语形态的有限状态转移网 络分析》②一文,是我国学者最早的研究计算术语学的论文,可是当时并没有引起我国术语 学界的关注,在我国术语学研究中,几乎还没有其他的文章专门讨论过计算术语学的问题, 本文根据计算术语学近年来的新发展,介绍计算术语学中单词型术语的结构自动分析方法, 希望我国术语学工作者能够关注计算术语学这个新兴领域的研究,以推动我国术语学研究现 代化的进程。 单词型术语结构分析的目的是让计算机知道单词型术语的结构,并且把与该术语有关的 ① D. Bourigault, Ch. Jacquemin, Marie-Claude L’Homme, Recent Advances in Computational Terminology, John Benjamins Publishing Company, 2001. ② 冯志伟,日语形态的有限状态转移网络分析,《术语学与知识转播国际会议论文集》,1997 年,北京。 语言学信息(主要是形态信息)自动地加在该术语上,为术语进一步的自动处理做好准备。 这是计算术语学最为基础的工作③ 。 单词型术语是由一个单词构成的,其中仅仅包含一个单词。一般地说,单词可以由词根、 词缀和词尾构成,词根和词缀可以组成词干,词根后面也可以没有后缀而单独成为词干,在 这种情况下,为了表述上的方便,我们就直接简单地把它叫做词干。这样,我们就可以用如 下的“有限状态转移网络”(Finite State Transition Network ,简称FSTN )来表示一个单词的 词法分析过程④ 。 图 1 用限状态转移网络作词法分析 在图中,如果一个单词只包含词干(这时词干也就是词根),则其遍历过程是:q0

文档评论(0)

nnh91 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档