中文信息学报基于本体的跨语言信息检索模型.PDF

中文信息学报基于本体的跨语言信息检索模型.PDF

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文信息学报基于本体的跨语言信息检索模型

中 文  信  息  学  报 第 18 卷 第 3 期   JOURNAL OF CHINESE INFORMATION PROCESSING Vol 18 No3 ( ) 文章编号 :1003 - 0077 2004 03 - 0001 - 08 基于本体的跨语言信息检索模型 王  进 ,陈恩红 ,张振亚 ,王煦法 ( 中国科学技术大学 计算机科学技术系 ,安徽 合肥  230027) 摘要 :随着网络信息的日益丰富和用户需求的提高 ,人们已经不能满足于仅仅在同一语种中进行检索 ,跨 ( ) 语言的信息检索 CLIR 因而受到人们越来越多的关注 。为此 ,本文提出了一种新的基于语义的跨语言信息检 索模型 OntoCLIR ,该模型在传统信息检索技术的基础上 ,利用本体来刻画不同语言中对应的领域知识 , 以解 决从查询语言到检索语言之间转换过程中出现的语义损失和曲解等问题 ,从而保证在检索过程中能够有效 地遵循用户的查询意图 ,获得预期的检索信息 。本文以体育新闻检索为背景 , 以英文查询作为查询请求 ,检索 来自新浪网的体育类新闻 ,结果表明采用基于本体的跨语言信息检索方法之后检索的查全率和查准率平均 提高 10 个百分点左右 ,有效地改善了检索性能 。 关键词 :计算机应用 ; 中文信息处理 ;本体 ;跨语言信息检索 ;语义 中图分类号 :TP311    文献标识码 :A An OntologyBased Cross Language Information Retrieval Model WAN GJin ,CHEN Enhong ,ZHAN G Zhenya ,WAN G Xufa (Department of Computer Science , USTC , Hefei , Anhui 230027 ,China) Abstract :With the enrichment of network information and the improvement of the users needs , people are not satisfied with retrieving in the same kind of language . So CrossLanguage Information Retrieval (CLIR) receives peoples more and more concerns . One of kernel problem of CLIR is how to overcome communication obstacles between different languages. This pa per proposes a novel semanticbased CLIR model OntoCLIR. The model , basing on the technologies of traditional informa tion retrieval , uses Ontology to describe the relevant domain knowledge in different kinds of languages. Thus the problems of semantic loss and distortion when translating between query language and retrieval language can be solved. In this way we can ensure that the model will follow users query intention and get t

您可能关注的文档

文档评论(0)

laolao123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档