- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文信息学报基于本体的跨语言信息检索模型
中 文 信 息 学 报
第 18 卷 第 3 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol 18 No3
( )
文章编号 :1003 - 0077 2004 03 - 0001 - 08
基于本体的跨语言信息检索模型
王 进 ,陈恩红 ,张振亚 ,王煦法
( 中国科学技术大学 计算机科学技术系 ,安徽 合肥 230027)
摘要 :随着网络信息的日益丰富和用户需求的提高 ,人们已经不能满足于仅仅在同一语种中进行检索 ,跨
( )
语言的信息检索 CLIR 因而受到人们越来越多的关注 。为此 ,本文提出了一种新的基于语义的跨语言信息检
索模型 OntoCLIR ,该模型在传统信息检索技术的基础上 ,利用本体来刻画不同语言中对应的领域知识 , 以解
决从查询语言到检索语言之间转换过程中出现的语义损失和曲解等问题 ,从而保证在检索过程中能够有效
地遵循用户的查询意图 ,获得预期的检索信息 。本文以体育新闻检索为背景 , 以英文查询作为查询请求 ,检索
来自新浪网的体育类新闻 ,结果表明采用基于本体的跨语言信息检索方法之后检索的查全率和查准率平均
提高 10 个百分点左右 ,有效地改善了检索性能 。
关键词 :计算机应用 ; 中文信息处理 ;本体 ;跨语言信息检索 ;语义
中图分类号 :TP311 文献标识码 :A
An OntologyBased Cross Language Information Retrieval Model
WAN GJin ,CHEN Enhong ,ZHAN G Zhenya ,WAN G Xufa
(Department of Computer Science , USTC , Hefei , Anhui 230027 ,China)
Abstract :With the enrichment of network information and the improvement of the users needs , people are not satisfied with
retrieving in the same kind of language . So CrossLanguage Information Retrieval (CLIR) receives peoples more and more
concerns . One of kernel problem of CLIR is how to overcome communication obstacles between different languages. This pa
per proposes a novel semanticbased CLIR model OntoCLIR. The model , basing on the technologies of traditional informa
tion retrieval , uses Ontology to describe the relevant domain knowledge in different kinds of languages. Thus the problems of
semantic loss and distortion when translating between query language and retrieval language can be solved. In this way we
can ensure that the model will follow users query intention and get t
您可能关注的文档
- 一种低静态电流高稳定性的LDO线性稳压器ALow-电子与信息学报.PDF
- 一种基于[;7V67平台和物联网技术的光伏发电监测系统 - 电子测量技术.PDF
- 一种基于三维加速度传感器的人体行为识别方法-计算机系统应用.PDF
- 一种在电子出版中融合固定版面与流式信息的方法-电子学报.PDF
- 一种基于位错机制的动态应变时效模型.PDF
- 一种基于故障电流特性的反孤岛保护技术-山东大学.PDF
- 一种启发式有环河系自动分级算法-测绘通报.PDF
- 一种多项式时间的路径敏感的污点分析方法-计算机学报.PDF
- 一种基于遗传算法的Fuzzing测试用例生成新方法-电子学报.PDF
- 一种改进的BFT型片上网络拓扑结构-计算机系统应用.PDF
- 统编版(五四学制)语文四年级上册第八单元《口语交际:讲历史人物故事》教学设计.docx
- 统编版(五四学制)语文四年级上册第七单元《梅兰芳蓄须》教学设计.docx
- 人教鄂教版(2024)小学科学一年级上册第一单元《不倒翁》教学设计.docx
- 人教鄂教版(2024)小学科学一年级上册第三单元《更多的家养动物》教学设计.docx
- 人教版(2024)美术七年级上册第四单元《活灵活现》教学设计.docx
- 统编版(五四学制)语文五年级上册第五单元《习作:介绍一种事物》教学设计.docx
- 人教鄂教版(2024)小学科学一年级上册第四单元《制作杯垫》教学设计.docx
- 西师大版小学数学三年级上册《认识周长》教学设计.docx
- 统编版(五四学制)语文五年级上册第八单元《口语交际:我最喜欢的人物形象》教学设计 - 副本.docx
- 人教版(2024)美术七年级上册第四单元《身临其境》教学设计.docx
文档评论(0)