基于特定领域本体的术语扩充方法-计算机软件与理论专业论文.docxVIP

基于特定领域本体的术语扩充方法-计算机软件与理论专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于特定领域本体的术语扩充方法中文摘要 基于特定领域本体的术语扩充方法 中文摘要 随着社会各学科知识的剧增,各种新知识,新术语层出不穷。为了适应对于 领域词典的编写要求,从浩如烟海的科技文献中找到领域相关的新术语,本文提 出了一种基于领域本体的新术语扩充方法。该方法可作为领域专家收录领域术语 的重要辅助手段。 本文介绍了中外关于术语识别,术语扩充的相关工作,总结了传统的基于统 计特征和基于规则的方法。给出术语扩充的指导原则,并结合传统方法,提出一 种基于领域本体的术语扩充方法。该方法计算出词语在文档中的影响,使用领域 本体来体现领域知识,通过在文档中识别出的本体中概念来计算文档及词语的领 域相关度,通过本体概念匹配结果统计文档及术语相关类别,最终获得术语候选 项的推荐排序,可以对术语候选项推荐结果进行优化。设计实验及提供结果分析, 说明该方法的有效性和可行性,同时给出了这一工作的总结和展望。 【关键词】 术语扩充,领域本体,领域相关度 【中图分类号】 TP31 基于特定领域本体的术语扩充方法Abstract 基于特定领域本体的术语扩充方法 Abstract Lots of new terms appear with the increasing of new knowledge in every domain. For the purpose of finding new terms in documents of specific fields,a method for new term recognition based on domain ontology is proposed in the paper.It will help domain experts in compiling domain dictionaries. This method combines linguistic rules and statistical methods to get the infection degree from words to documents,and optimize the term candidate result by using domain ontology to recognize concept in document and to calculate correlation degree between word,document and specific domain.The validity of the method is proved with a practical case. [Keywords】 Domain Ontology;Domain Correlation Degree;New Term Recognition [Class Numberl TP31 6 基于特定领域本体的术语扩充方法第一章术语扩充问题介绍 基于特定领域本体的术语扩充方法 第一章术语扩充问题介绍 1.1.引言:问题描述及研究意义 术语(Term),为“在特定领域中一般概念的词语指称[1]”,如农业领域中的 “氮肥”、“叶柄”“小麦赤霉病”等等专用在农业领域,具有特定的意思。术语 多用于技术文献、标准和规定中,其含义局限在一定的范围内。当代社会已经进 入信息时代,知识激增,以致随之而来的新术语,需要统一和审定[2]。所以新 术语扩充目前已是一项非常重要应用,领域术语扩充结果,也可用于建立各个领 域的数据知识库。 因为术语具有比较强的规范性,所以对术语的识别、认定、术语词典的编纂 都往往滞后于术语的出现,需要每隔一段时间进行术语扩充。术语扩充目标就是 要找到那些不在术语词典中出现,同时又与本领域密切相关的词语或短语,补充 到术语词典中。传统术语词典的编撰和扩充需要领域专家手工进行,有时需要阅 读大量新的技术文献,从中去找到新术语,往往费时费力,而且人也容易疲劳, 容易有误判情况。同时,如果有多个领域专家协同参与,评定标准也不好统一。 如果能够使用计算机辅助领域专家识别领域相关的术语候选项,再通过专家交互 式参与选择确定,会有比较好效果,这就是本文所关注问题一一计算机辅助新术 语扩充的研究动因。 术语扩充,’也可以说是新术语识别,是一个相对概念,所谓的“新”,就是 相对已有的领域术语词典而言。领域术语词典,即包含特定领域内部代表本领域 特定知识概念的术语的词典。另外平时使用较多的是一般词典,也称为通用词典, 即日常口语和书面语常用词典,往往作为计算机对文档分词处理的粗分词典。 现在互联网技术发展迅速,很多知识可以从网络上获得,来自中国互联网络 信息中心(China Internet Network Informat

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档