从术语知识发现视角看术语科学定名的重要性.docVIP

从术语知识发现视角看术语科学定名的重要性.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从术语知识发现视角看术语科学定名的重要性.doc

从术语知识发现视角看术语科学定名的重要性   摘要:科学的术语定名是术语工作的一项重要内容。一个科学的概念指称的创立,是术语推广、传播与术语标准化工作的前提条件。文章从术语知识发现这一新的视角论述了术语科学定名对于术语知识发现工程的重要作用,从应用角度进一步论证了术语科学定名的重要性。   关键字:术语定名,术语知识发现,术语定义抽取,术语定义聚类,术语识别   中图分类号:H083;N04文献标识码:A文章编号:1673-8578(2015)03-0014-04   Abstract:The scientific term designation is one of the most important aspects in term work. The creation of the designation of a concept is the prerequisite for the popularization, spread and standardization of terms. This paper analyzes the importance of scientific term designation from the perspective of term knowledge discovery.   Keywords: term designation,term knowledge discovery,term definition extraction, term definition clustering, term recognition   术语定名是给一个概念制定科学的术语的过程。术语定名应遵循准确性、单义性、系统性、语言的正确性、简明性、理据性、稳定性、能产性原则[1]。上述原则对于术语所指称概念的推广与传播、术语标准化工作都具有重要的理论与现实意义。   近年来,术语学研究与中文信息处理技术相结合成为术语学研究的新方向。术语知识发现的相关研究已有了不少的成果。本文将从基于大规模语料的术语定义抽取、术语定义聚类与术语识别三大主要术语知识发现的应用研究出发[2],探讨术语科学定名对于术语知识工程的支撑作用,从语言工程的实现过程对术语科学定名的重要性进行论述。   一术语科学定名在术语定义抽取中的作用   术语定义抽取是了解术语概念最基本、最直接的方式。基于网络海量信息的术语定义抽取通常是将一个术语查询项提交给抽取系统,系统根据该查询项关键词进行文本检索,再通过一系列规则与统计的计算方法,将得分最高的句子抽取出来作为术语定义的最优选项 [3-4]。   冯志伟认为名称与概念之间具有单参照性,即一个名称与一个且只与一个概念相对应。他还认为术语的同义现象会导致术语使用的混乱。在术语工作中,应该尽量减少术语的同义现象,这是术语标准化的任务之一[5] 。   当术语同义现象严重时,由于提交给查询系统的关键词每次只有一项,这就必然造成系统无法识别出包含其同义术语的文本集合,从而降低了抽取系统的准确率。例如,路甬祥谈到术语滥用的问题时举例,“ergonomics”一词,分别有人机学、人机工效学、人类工程学、人体工程学、生物工艺学、人类环境改造学、劳动经济学、工作环境改造学、工效学等22种叫法[6]。   我们将上述名称分别作为查询关键词,提交给术语定义抽取系统,进行实验。对抽取结果分析后发现,提交查询项对抽取质量的影响较大。系统的准确率与查询项术语的使用频率正相关。在公众中知晓度与使用度相对较高的术语如“人机学”“人际工效学”“人体工程学”作为查询项时,系统返回的文本数量较大,文本中的信息与术语定义相关度高,抽取准确率高。反之,使用的查询项权威度、知晓度、流通度与使用频率均较低时,虽然多数搜索引擎在关键词处理过程中会使用同义词扩展功能,但抽取结果排序时通常给原始查询项赋予一个较高的权重,这就造成质量较高的同义词定义排在后面,从而降低了抽取结果的准确率。例如“人类环境改造学”“工作环境改造学”由于在公众中的知晓度与使用度降低,搜索引擎返回的文本数量极其有限,抽取出的候选句子的数量会受到很大的制约。同时,由于知晓度低,这些文本并非包含权威机构发布的术语定义,通常是网络上自媒体参与者发表的个人观点,客观性、规范性与科学性都无法得到保证,在这些文本集合中进行术语定义的自动发现,会大大降低术语知识提取的准确度。   从语义角度考察,在这22种叫法中,“生物工艺学”“劳动经济学”与源语语义相似度较小,与科技文献翻译的相对等值性原则背离甚远,以该类词语作为查询项得到的结果显然不能对所指称概念进行合理的描述。   作为查询项的术语,其定名的合理度即与术语的定名原则契合度越高,对识别系

文档评论(0)

jingpinwedang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档