近年来国外信息检索的相关性研究进展.docx

近年来国外信息检索的相关性研究进展.docx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

近年来国外信息检索的相关性研究进展

?

?

?

摘要:国外的相关性研究至今已有上百年的历史,出现了两个主要的研究流派,即面向系统的相关性研究和面向用户的相关性研究,相关性是动态的、多维的、可认知的和可测度的等观点,已成为学术界的共识。1997年之后的相关性研究在基础研究和实证研究方面都有很大进展。信息检索的相关性研究已经深入到信息检索的各个领域,如模型、算法、聚类、查询扩展与精化、相关性判断等。随着相关性研究的不断深入发展,信息检索系统将会越来越贴近用户的信息需求。图1。表2。参考文献20。

?

关键词:信息检索,相关性,国外

?

1信息检索相关性研究的历史

?

信息检索相关性的研究经历了比较长的时间,可以划分为不同阶段,各个阶段的研究重点也有不同。StefanoMizzaro1997年在他的分析中认为,相关性研究从起始到20世纪90年代中期,大体上可以划分为3个阶段:①1958年之前;②1959~1976年;③1977年至20世纪90年代中期。其研究内容可以归纳为7个方面,即方法论基础、相关性类型、由用户所采纳的优于主题性的判断标准、描述相关性判断的模型、相关性动态属性、文档类型和相关性判断标准[1]。

?

第一阶段(1958年以前):相关性的历史可能起源于100年前,并且首先出现在图书馆,图书馆用户很早就已经关注到寻找相关信息的问题了。这个阶段具有隐性的特点,在相关性概念的背后有很多研究,但都比较肤浅,几乎没有人能明确地阐述这一主题。这一阶段结束于1958年,以该年举行的科学信息国际会议(IC-SI)为标志,在此次会议上人们开始明确地认识到相关性的概念。

?

第二阶段(1959~1976年):这一阶段掀起了相关性研究的第一次高峰,出现了产生重大历史影响的大型实证研究以及一系列理论研究。结束的标志是Saracevic在1975年和1976年发表的相关性研究阶段性综述,综述对前人提出的相关性概念进行了归类。该阶段的实证研究主要包括1955年由Kent等提出的用查全率和查准率等指标进行的检索系统评估、Cran-rield测试(由1957年的CranfieldⅠ和1962年的CranfieldⅡ两个项目组成)、Cuadra与Katter(1967年)和Rees与Schultz(1967年)两个小组分别展开的测试。这些实证研究都是从多个方面对相关性进行研究的,而不仅仅局限于Mizzaro所述7个方面中的某一个。并且,这些实证研究的文章和Saracevic的文章都被下一阶段的文章所大量引用。

?

第三阶段(1977年至20世纪90年代中期):自20世纪90年代开始,相关性研究迎来了第二次高峰。该阶段研究的特点是从面向系统的观点逐步转移到面向用户方面,更多的是从用户认知的角度开展研究。影响比较大的有1994年的JournaloftheAmericanSocietyforInformationScience(JASIS)相关性专辑,包括Scham-ber、Park、Barry和Wang等人在内的4篇博士论文,以及Schamber、Froehlich、Saracevic、Mizzaro、Bofiund等人发表的综述与述评。

?

综观国外针对相关性的研究,从20世纪30年代算起,至今已有70多年的历史,其间出现过两个主要的研究流派,分别是面向系统的和面向用户的相关性研究。研究高峰分别集中于20世纪60年代至70年代前期和80年代中后期至今两个阶段。相关性是动态的、多维的、认知的和可测度的等观点,已经成为学术界的共识。为了更好地组织和梳理异彩纷呈的相关性研究,Saracevic、Mizzam以及Bodund等人分别建立了各自的模型,以利于从整体上对相关性研究加以认识。在国外对相关性研究的文章当中,笔者发现实证研究是采用的最基本手段。

?

2相关性研究

?

2.1近年来国外相关性研究概况

?

通过对外文全文数据库(ScienceDirect、WileyInterScience、SpringerLINK)的检索,在1997~2007年这一时间段检索出70多篇有关相关性研究的外文文献,分析论文发表的时间分布发现,相关性研究在2003年前后以及2007年呈现出研究的高峰期(见图1)。对文章的关键词进行分析,在70篇文章当中总共含有354个关键词(其中有1篇文章没有关键词标引),其中关于相关反馈、查询扩展、相关性排名、检索效率等方面的研究是比较多的(见表1)。

?

?

?

?

2.2相关性的基础性研究

?

相关性(Relevance)一词在英语词典中解释为“therelationofsomethingtothematterath

文档评论(0)

159****8201 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档