基于多语本体的语义查询扩展研究-数字图书馆论坛.pdfVIP

基于多语本体的语义查询扩展研究-数字图书馆论坛.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多语本体的语义查询扩展研究-数字图书馆论坛

探索与交流 基于多语本体的语义查询扩展研究* 1 2 司莉,潘秋玉 (1. 武汉大学信息资源研究中心,武汉430072 ;2. 武汉大学信息管理学院,武汉430072) 摘要:查询扩展是改善信息检索结果的有效方法。针对用户获取多语言信息的需求以及当前跨语言信息检 索存在的翻译歧异性问题,提出一种基于多语本体的语义查询扩展方法,介绍其基本原理、查询扩展模型及实 现过程,使跨语言信息检索从字符匹配变成语义层面的匹配,实现跨语言信息检索中的查询扩展,以提高多语言 信息检索的查全率和查准率。 关键词:查询扩展;多语本体;跨语言信息检索 中图分类号:TP391 DOI :10.3772/j .issn .1673-2286.2016.2.006 1 引言 必要的。查询扩展的基本思想是对用户输入的初始查询 词进行修正和扩充,构建更明确清晰的查询表达式,以 查询扩展作为提高信息检索性能的关键技术,自 改善信息检索的查全率和查准率。扩充的查询词有两大 20世纪60年代提出以来就逐渐受到关注。尤其是近年 类:一是查询词的同义或近义词,二是加入全新的词汇。 来,在计算机技术、云计算、物联网、用户创造内容等 目前,查询扩展的常用方法有3种:①基于用户相 多重因素的推动下,Int er net 已成为一个海量且仍在迅 关反馈的查询扩展;②基于全局分析的查询扩展;③基 猛增长的信息库,与此同时,网络信息语种的多样化和 于局部分析的查询扩展。其中,第一种要求用户对查询 网络用户分布的国际化日益显著,实现多语言信息组织 结果进行相关性判断,系统对用户判断后的相关文档 与检索,使用户方便获取多语言信息,成为信息检索系 进行计算,选取一些词扩展查询式进行二次检索,如此 统发展的趋势之一。然而,不同语言概念之间的准确对应 反复直至用户满意,该方法可以很好地满足用户需求, 始终是制约多语言信息检索的瓶颈。由于本体表达概念 但对用户要求较高、负担较重;第二种是系统自动对全 语义和推理的能力较强,可消除自然语言理解中的歧义, 部文档中的词或词组进行相关分析,将与查询词关联 并能根据相关概念进行推理,在多语言信息检索中实现 度较高的词作为初始查询词的扩展词来生成新的查询 基于本体的语义查询扩展,将有效提高多语言信息检索 式,其缺点是当文档数量较多时,计算量会比较大;第 的查全率和查准率,从而促进全球知识交流与共享。 三种不需要用户参与,系统自动将查询结果中的前K篇 文档作为相关文档,计算后选取扩展词进行重新检索, 2 现有的查询扩展技术 但容易发生“查询漂移”现象,即扩展后的查询主题偏 离了用户原来的查询意图。 传统信息检索系统利用简单的词匹配法则,即计 算文档特征值与检索词之间的相似度,往往只能检索 3 基于多语本体的查询扩展方法 到包含查询词的那些资源。而用户输入的89.9% 的检索 [1] 查询只包含一个词,平均查询词为1.73个 ,这样,与用 3.1 多语本体的特征 户查询请求相关但未包括检索词的那部分资源便无法 被命中。可见,实现用以提高查全率的查询扩展是极为 本体是对概念及概念之间关系规范化、形式化、可 * 本研究得到教育部人文社会科学重点研究基地重大项目“基于内容的多语言信息组织与检索研究” (编号:14JJD870001)资助。 年第 期(总第 期) 2016 2

您可能关注的文档

文档评论(0)

suijiazhuang1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档