基于概念空间的术语数据库词间关系构建的探究.pdfVIP

基于概念空间的术语数据库词间关系构建的探究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2012 年全国知识组织与知识链接学术交流会·北京 基于概念空间的术语数据库词间关系构建研究 徐伟伟,刘清水 (中国农业大学图书馆,北京,100083) 摘要:叙词表在自然语言检索中的应用是当今情报检索语言领域的研究热点。与叙词表 相比,术语数据库的概念表达规范、标准,且更新快。本文将叙词语言中的词汇受控原理引 入到概念空间基础上的术语数据库词间关系构建上,探讨结合自然语言与人工语言的各自优 势以提高网络信息检索效率的新途径。 关键词:术语;术语数据库;叙词;概念空间;自然语言处理;信息检索 Construct and Research on the Relationships between Terms of Terminological Data Bank based on Concept Space XU Weiwei, LIU Qingshui (Library, China Agriculture University, Beijing, 100083, China ) Abstract:The application of thesaurus to natural language searching is a hot research field of information retrieval language.Compared withthesaurus, conception in terminological data bank is more normative, standardized and updated. The principal of vocabulary control in thesaurusis introduced into the relationship architecture between the terms of terminological databank on the basis of concept space to build new ways to explore the respective advantages of the combination of natural language and artificial language in order to improve the efficiency of network information retrieval. Keywords:term, terminological data bank; thesaurus; concept space; natural language processing; information retrieval 1 引言 网络信息技术的迅速发展和信息资源指数级的增长导致用户搜集利用信息的行为发生 了巨大改变,以自然语言索引信息的搜索引擎成为人们获取信息的主要手段,但自然语言表 达概念的模糊性却限制了关键词字面匹配的全文检索效率的提高。实现对网络信息的有效组 织,将情报检索语言中的词汇控制原理引入到自然语言检索中,实现人工语言和自然语言的 [1][2] 相互结合成为提高网络信息检索效率的有效途径之一 。 术语数据库是表达特定学科领域内概念的术语的集合,集合本身即形成了含有潜在语义 关联的概念网络。本文以农业机械化术语数据库[3]为例,利用自动标引和共现分析技术建立 起含有术语之间关联程度的概念空间,再结合相关算法细化术语间的关联程度以得到较准确 的词间关系,从而为术语数据库在自然语言检索中进行语义消歧和检索扩展奠定基础。 2 概念空间生成 标引和检索的匹配是信息检索的核心。自然语言表达中的“一词多义”和“一义多词”现象 使得标引者和检索者在用词上很难进行精确匹配,检索者表达自身检索需求时的用词模糊性 又加剧了这一矛盾。解决问题的关键是要对检索和标引用词进行控制。事实上,概念之间广 泛存在的语义关联为词间关系控制提供了基础。 术语数据库可以视作概念间各种关系尚未明确化的“概念空间”,通过收录特定领

文档评论(0)

youyang99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档