- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一个新兴的术语学科--计算术语学.pdf
《术语标准化与信息技术》,2008年第四期,总第52期,4-9.
一个新兴的术语学科 -- 计算术语学
冯志伟
摘要:术语在科学技术文献中分布很广,术语的自动处理和识别对于科学技术文献的分析、识别和
生成至关重要。本文介绍了术语学中的一个新兴学科—计算术语学,分别介绍了术语的发现、术语
的充实、术语的受控标引、术语的自由标引等问题。
关健词:计算术语学,术语发现,术语充实, 受控标引,自由标引。
A new scientific domain in terminology
–Computational Terminology
Feng Zhiwei
Abstract: Terms are pervasive in scientific and technical documents; their
automatic processing and identification are the crucial issues for any
application dealing with the analysis, understanding, generation or translation
of such documents. This paper introduces a new scientific domain in terminology
– computational terminology, it presents term acquisition, term enrichment, term
controlled indexing and term free indexing.
Key words: computational terminology, term acquisition, term enrichment,
controlled indexing, free indexing.
近年来,在术语学的研究中,开始引进自然语言的计算机处理的方法和技术,出现了“计
算术语学”1 (computational terminology)这样的学科。1998年的计算语言学国际会议
COLING-ACL’98上,组织了世界上第一次计算术语学的讨论会(First Workshop on
Computational Terminology),这次讨论会首次使用的“计算术语学”这个学科名称。这次
讨论会讨论的问题主要有:
如何抽取术语以满足信息检索的需要;
如何抽取术语以便使用双语语料库来进行翻译;
如何进一步完善和原有术语抽取的工作(例如,如何建立概念层级网络,如何搜索语
义信息或概念信息)。
1 D. Bourigault, Ch. Jacquemin, Marie-Claude L’Homme, Recent Advances in Computational
Terminology, John Benjamins Publishing Company, 2001.
1998年的这次讨论会成为了计算术语学发展的催化剂,从此,计算术语学便成为一个新
兴的术语学的学科,活跃在当代科学技术的百花园中,并且一天天地成熟起来,初步具备了系
统的理论和有效的方法,值得我们特别地关注。在“计算术语学”这个名称出现 10年之前,
我国冯志伟在 1988年就注意到术语的自动处理问题,他在德国夫琅禾费研究院(Fraunhofer
Institute )使用计算机对汉语的词组型术语进行了自动结构分析,是国际上最早进行计算术语学
研究的学者之一2 。计算术语学的研究主要包括术语结构的自动剖析、术语的自动发现、术语
的自动标引等。 本文主要介绍术语的术语的自动发现和术语的自动标引。
在自然语言的计算机处理的诸多领域中,都离不开术语,例如,机器翻译(machine
translation)目前主要是翻译专业性的文献,术语的自动处理与机器翻译系统的译文质量有
密切的关系;此外,信息检索(information retrieval)、信息抽取(information
extraction)、文本分类(text classification)的运算的基本单位都是单词型术语或词组
型术语,也离不开术语的自动处理。
文档评论(0)