- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索模型及其在跨语言信息检索中应用进展
信息检索模型及其在跨语言信息检索中的应用进展
〔摘 要〕信息检索发展中的一个重要理论问题是如何对查询与文档进行匹配,由此形成了不同的信息检索模型。跨语言信息检索是信息检索研究的一个分支,也是近年来的热点问题。本文主要对信息检索模型的研究进展,及其在跨语言信息检索中的应用进展进行分析与综述。
〔关键词〕信息检索;跨语言信息检索;检索模型
〔中图分类号〕G354 〔文献标识码〕B 〔文章编号〕1008-0821(2009)07-0215-07
Development of Information Retrieval Model and its
Application in Cross-Language Information RetrievalWu Dan1 Qi Heqing2
(1.School of Information Management,Wuhan University,Wuhan 430072,China;
2.Shandong Dezhou Dehua Mechanical Equipment Engineering Corporation Limited,Dezhou 253000,China)
〔Abstract〕An important theoratical problem in informaton retrieval is how to match the query and the documents,therefore,different information retrieval models are formed.Cross-language information retrieval(CLIR)is a branch of information retrieval research fields and is one of the most active information retrieval areas in the past decades.This paper analyzes the reviews and the progresses of information retrieval models and its application in cross-language information retrieval.
〔Key words〕information retrieval;cross-language information retrieval;retrieval model
作为一个正式的学术概念,信息检索(Information Retrieval)于1948年由美国学者Mooers[1]在其硕士学位论文中首次提出。经过半个多世纪的研究,信息检索的发展演变可以看作是不断消除一道道信息存取障碍的过程。首先,从脱机批处理到计算机检索系统的产生,是超越了信息存取的速度障碍;其次,从单机到网络平台,从集中式网络到分布式、异构性、动态Web环境的迁移,是打破了信息存取的空间障碍;再次,从分类法、主题词表到本体(Ontology)的出现和应用,是跨越了信息存取的语义理解障碍。即便如此,在全球信息共享的迫切要求下,依然还有另一道障碍未被攻克,即信息存取的语言障碍。
跨语言信息检索(Cross-Language Information Retrieval,CLIR)是20世纪70年代从信息检索领域发展出来的一个分支,旨在以一种语言的查询去检索另一种语言的信息资源,这一技术已成为突破信息存取语言障碍的关键。跨语言信息检索在一定程度上继承了传统信息检索技术的发展,其关键问题是要使查询语言与文档语言在检索之前达成一致。
信息检索发展中的一个重要理论问题是如何对查询与文档进行匹配,由此形成了不同的信息检索模型。经过60年的发展,信息检索模型已由原来的三大经典模型――布尔模型、向量空间模型、概率模型,发展为时下非常流行的统计语言模型和语义处理模型。同时,这些传统检索模型和新兴检索模型都在跨语言信息检索领域发挥着非常重要的作用。本文主要对信息检索模型的研究进展,及其在跨语言信息检索中的应用进展进行分析与综述。
1 信息检索模型研究进展
一般的信息检索模型由以下四部分组成:(1)查询表示;(2)文档表示;(3)匹配机制;(4)反馈修正。用形式特征可以将信息检索模型表示为一个四元组的模型框架:[D,Q,F,R(q??i,d??j)]。其中,D是文档表示;Q是查询表示;F是一种机制,用于构建文档表示、查询表示及它们之间关系的模型;R(q??i,d??j)是一个排序函数,该函数输出一个与查询表示
原创力文档


文档评论(0)