关于建立面向应用规范词异名库若干理论探讨.docVIP

关于建立面向应用规范词异名库若干理论探讨.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于建立面向应用规范词异名库若干理论探讨

关于建立面向应用规范词异名库若干理论探讨   摘要:收集整理规范术语的异名,用于开发面向应用的术语纠错工具,可使规范科技术语的宣传与推广工作达到事半功倍的效果。规范词异名是指与国家审定公布的规范科技术语“正名”表达相同概念,但词形不同的非推荐名。规范词异名的认定需经过收词和审词两个阶段。收词方法包括人工收集和自动抽取。通过规则和统计并举的自然语言处理技术进行自动抽取,可以有学科领域关联、英文术语一词多译关联、语义网络关联三种路径。规范词异名的人工收集和审词重在确保语义等价。   关键词:规范词,异名,语义等价,自然语言处理   中图分类号:H083;N04 文献标识码:A文章编号:1673-8578(2013)04-0012-05   收稿日期:2013-03-29   作者简介:张晖(1983—),男,湖北荆州人,硕士,全国科学技术名词审定委员会事务中心宣传与推广室副主任、审定编辑,研究方向为一般管理学、术语管理。通信方式:zhangh@cnctst.gov.cn。   一收集整理规范词异名的现实意义   根据笔者2012年对全国20多个省市自治区,100多家科研、教学、新闻出版、医疗等企事业单位的中、高级科技工作人员进行的相关调查发现,超过90%接受书面访谈的受访者对国家开展科技名词规范化工作表示认同,认为这项工作对科技发展与交流具有基础性作用。全国科学技术名词审定委员会(以下简称全国科技名词委)于近年专门成立宣传与推广部门,负责协调规范科技术语的宣传与推广工作,目前已基本形成以科技术语出版物、科技术语网络服务、科技术语教育培训为主体,注重发挥媒体作用的宣传与推广格局。   现阶段,科技工作者对人性化科技服务的需求日益增长,给规范科技术语的推广工作提出了更高的需求。例如,新闻出版行业《图书质量管理规定》已明确规定:“工具书的科技条目、科技类教材、学习辅导书和其他科技图书,使用科技术语不符合全国科技名词审定委员会公布的规范词计1个差错。”[1]但现实问题是,新闻出版行业从业人员在编校实践中,往往需要关注的不是规范的科技术语,而是隐藏在各类出版物中需要及时加以纠正的不规范的科技术??。但由于不规范的科技术语与规范的科技术语在构词规则和用字规则上并无本质区别,因而往往依赖编辑人员或审稿专家自身的科技知识积累加以判别,使得规范科技术语的推广成本很高,效果不甚理想。   笔者认为,规范科技术语的宣传与推广工作,如果着力解决此类面向实际应用的现实课题,可以达到事半功倍的效果。从实际应用的角度研发可以识别非规范术语的纠错工具,运用于新闻出版、广播电影电视、科技教育等领域,具有非常重要的现实意义。从现有技术上来讲,纠错工具本身的技术并不复杂,纠错工具所依赖的规范词异名库的规模和质量,才是决定纠错工具好与坏的核心指标。   二规范词异名及其特征   异名,顾名思义,是指不同的名称。从术语规范的角度出发,“异名”是与“正名”相对的概念。全国科技名词委制定的《科技名词审定原则与方法》(以下简称《原则》)中对什么是“正名”,什么是“异名”,有着相应的界定:“一个概念有多个名称时,应确定一个名称为正名,其他为异名(包括‘全称’‘简称’‘又称’‘俗称’‘曾称’等)。其中,‘正名’为公布的规范名,‘全称’‘简称’为与正名等效使用的名词,‘又称’为非推荐名,只允许在特殊情况和一定范围内使用,‘俗称’为非学术用语,‘曾称’为已淘汰的旧名称。”①之所以如此界定,是因为“科学技术名词的规范和统一是一个渐进的研究过程,对那些目前暂时无法做到一词一义的名词,应采取在确定规范名的基础上对其同义词加以说明的方式,引导使用者逐步接受和正确使用规范名词”[2]。简而言之,《原则》中异名的产生,是通过渐进途径争取术语统一的变通之举,其数量有限。   本文所探讨建立的面向应用的规范词异名库所指的“异名”,是指与国家审定公布的规范科技术语“正名”表达相同概念,但词形不同的非推荐名。其基本特征应该包括以下3点:(1)与“正名”指代相同概念;(2)与“正名”词形有别;(3)不推荐使用。为了客观认识异名的产生过程并加以收集,还应该认识到以下两点:(1)异名应被书面语言或口头语言明确记录;(2)异名的数量难以预估或穷尽。由此可见,规范词库收集的异名与《原则》标注的异名有别,前者的初衷是用于开发实用工具,其异名数量需要达到一定的规模,而后者的初衷旨在通过渐进途径促进术语规范,异名数量必然有限。   用于开发术语自动纠错工具的规范词异名库,首先可以收选《原则》中所列举的绝大多数异名类型,并给出明确的使用建议。据不完全统计,全国科技名词委所审定公布的30万条规范科学技术术语中,标注有《原则》所称“异名”(含“全称”“简称”“又称”“曾称”“俗称”)的术语近150

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档