- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
术语词典知识组织模型及辅助编纂系统设计
摘 要 文章基于知识组织理论,提出了术语词 典知识表示的基本模型,作为术语词典编纂系统的知
识框架。对术语词典辅助编纂的系统架构进行设计
识框架。
对术语词典辅助编纂的系统架构进行设计,
分解为三个核心功能模块,将基于语料库的术语计算、 数据可视化、用户交互模块紧密结合,直接服务于术 语词典的编纂,提高知识生产效率。
关键词 术语词典 知识组织用户交互 术语计算 数字出版
一、引言
术语词典是面向专业领域提供知识服务的重要工 具。然而,现有术语词典的编纂还存在一些问题。例 如,术语词典的知识内容大多较为简略,主要提供释 义、英文翻译等内容,对于深层知识的组织和描述需 要提高。术语词典的编纂自动化程度偏低,不少术语 词典的编纂仍然沿用传统的手工方式,术语搜集、整 理、分类、排版、校对流程主要由人工完成,缺乏必 要的自动化辅助工具。这些简单重复的手工劳动极易 出错而且效率低下,导致术语词典编纂滞后于科技的 发展和语言事实的变化,且难以实现资源共享。(解海 江,章黎平2010;冯志伟2006;赵刚2011;张爱 朴2012)如何从知识组织的角度对术语知识进行深度 描述,进而设计半自动化的术语词典编纂系统,是当 前术语词典研究领域的重要课题,无疑具有十分重要 的意义。(王惠临,吴丹,石崇德2006;赖茂生,屈 鹏,谢静2009)
从本质上来说,术语词典编纂是进行知识生产的 重要环节,是词典学、术语学、图书情报学、计算语 言学等多个学科的前沿交叉领域。术语词典编纂系统 的设计首先要以知识组织为依据,准确揭示术语背后 的各类知识,形成统一、规范的知识表示框架,这需 要词典学、术语学和知识组织理论的相关成果。其次, 术语词典实现半自动化编纂、提高知识生产的效率, 需要积极吸收计算语言学在语料库建设、新词发现、 术语计算等方面的成果。最后,术语词典编纂带有浓 厚的知识工程特征,需要以工程管理的观点,实现知 识的共建共享、交互式协同与动态更新等。
本文首先对术语的知识表示框架进行描述,突出 知识组织的内聚性和关联性。再对术语词典辅助编纂 系统的功能模块进行设计,借助知识组织科学、计算 术语学、计算词典学的成果,研究术语词典编纂自动 化的相关技术,并对术语词典编纂中的相关机制进行 讨论。
二、相关研究
知识组织(Knowledge Organization,简称 KO)
是对人类知识进行有序化处理的过程,通过一定的描 述方式揭示知识之间的逻辑关系。随着人类知识的迅 猛增长,人们吸收了图书馆学、情报学、计算机科学、 知识工程学、现代语言学、认知心理学等学科的成果, 编制了百科全书、叙词表、分类表、本体、术语列表 等各种知识组织工具,为术语词典的编纂提供了丰富 的经验。在国际上,国际术语信息中心Termlnfo(http: // ) 国际知识组织协会 ISKO(http: 〃)等将术语与知识组织紧密联系,召开 学术会议,使术语与知识组织的结合日益紧密。
术语词典编纂系统的设计要以知识组织为依托, 形成较为规范的、半自动化的知识生产流程。术语词 典是提供专业知识服务的工具,需要对术语所指称的 客观事物或知识内容进行深度揭示。因此,术语词典 编纂要求编者不但要有语言知识,而且更重要的是要 有专业知识。术语词典注重的是术语的概念,且以语 词来表达这些概念,一般按照主题顺序排序。术语的 概念范畴、范畴成员之间的关系是术语词典研究的一 个重点,术语词典编纂以术语学和词典学为基础理论, 应用知识组织、计算语言学的基本方法和技术,经过 词汇收集、术语规范、知识描述、知识链接等,形成 人机两用的知识资源。(Zeng Marcia Lei 2008;宋培彦
2012;傅爱平,吴杰,李芸2009)
术语词典编纂的研究在国内外学术界得到了广泛
的关注,在理论研究和具体实践方面取得了丰富的成 果。西方国家已有大量术语词典出版并热销,例如《美 国国防部军语及相关术语词典》(U.S.Department of
Defense Military Language and Related Terminology Dictionary)、《简明牛津文学术语词典》(The Concise Oxford Dictionary of Literary Terms)等。我国自 20 世 纪90年代至今,已出版了《膜技术术语辞典》《涂料 术语词典》《新编美国军事术语词典》《英汉法律缩略 语词典》等。在此期间,还研制了一些双语词典辅助 编纂工具,例如,商务印书馆与南京大学联合开发的
CONULEXID词典编纂系统”、上海交通大学陆汝占教 授等开发的汉语词典编纂一体化环境”、广东外语外 贸大学词典学研究中心开发的“基于微观数据结构的 双语词典生成系统(简
文档评论(0)