- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
近年来国外信息检索的相关性研究进展
?
?
?
摘要:国外的相关性研究至今已有上百年的历史,出现了两个主要的研究流派,即面向系统的相关性研究和面向用户的相关性研究,相关性是动态的、多维的、可认知的和可测度的等观点,已成为学术界的共识。1997年之后的相关性研究在基础研究和实证研究方面都有很大进展。信息检索的相关性研究已经深入到信息检索的各个领域,如模型、算法、聚类、查询扩展与精化、相关性判断等。随着相关性研究的不断深入发展,信息检索系统将会越来越贴近用户的信息需求。图1。表2。参考文献20。
?
关键词:信息检索,相关性,国外
?
1信息检索相关性研究的历史
?
信息检索相关性的研究经历了比较长的时间,可以划分为不同阶段,各个阶段的研究重点也有不同。StefanoMizzaro1997年在他的分析中认为,相关性研究从起始到20世纪90年代中期,大体上可以划分为3个阶段:①1958年之前;②1959~1976年;③1977年至20世纪90年代中期。其研究内容可以归纳为7个方面,即方法论基础、相关性类型、由用户所采纳的优于主题性的判断标准、描述相关性判断的模型、相关性动态属性、文档类型和相关性判断标准[1]。
?
第一阶段(1958年以前):相关性的历史可能起源于100年前,并且首先出现在图书馆,图书馆用户很早就已经关注到寻找相关信息的问题了。这个阶段具有隐性的特点,在相关性概念的背后有很多研究,但都比较肤浅,几乎没有人能明确地阐述这一主题。这一阶段结束于1958年,以该年举行的科学信息国际会议(IC-SI)为标志,在此次会议上人们开始明确地认识到相关性的概念。
?
第二阶段(1959~1976年):这一阶段掀起了相关性研究的第一次高峰,出现了产生重大历史影响的大型实证研究以及一系列理论研究。结束的标志是Saracevic在1975年和1976年发表的相关性研究阶段性综述,综述对前人提出的相关性概念进行了归类。该阶段的实证研究主要包括1955年由Kent等提出的用查全率和查准率等指标进行的检索系统评估、Cran-rield测试(由1957年的CranfieldⅠ和1962年的CranfieldⅡ两个项目组成)、Cuadra与Katter(1967年)和Rees与Schultz(1967年)两个小组分别展开的测试。这些实证研究都是从多个方面对相关性进行研究的,而不仅仅局限于Mizzaro所述7个方面中的某一个。并且,这些实证研究的文章和Saracevic的文章都被下一阶段的文章所大量引用。
?
第三阶段(1977年至20世纪90年代中期):自20世纪90年代开始,相关性研究迎来了第二次高峰。该阶段研究的特点是从面向系统的观点逐步转移到面向用户方面,更多的是从用户认知的角度开展研究。影响比较大的有1994年的JournaloftheAmericanSocietyforInformationScience(JASIS)相关性专辑,包括Scham-ber、Park、Barry和Wang等人在内的4篇博士论文,以及Schamber、Froehlich、Saracevic、Mizzaro、Bofiund等人发表的综述与述评。
?
综观国外针对相关性的研究,从20世纪30年代算起,至今已有70多年的历史,其间出现过两个主要的研究流派,分别是面向系统的和面向用户的相关性研究。研究高峰分别集中于20世纪60年代至70年代前期和80年代中后期至今两个阶段。相关性是动态的、多维的、认知的和可测度的等观点,已经成为学术界的共识。为了更好地组织和梳理异彩纷呈的相关性研究,Saracevic、Mizzam以及Bodund等人分别建立了各自的模型,以利于从整体上对相关性研究加以认识。在国外对相关性研究的文章当中,笔者发现实证研究是采用的最基本手段。
?
2相关性研究
?
2.1近年来国外相关性研究概况
?
通过对外文全文数据库(ScienceDirect、WileyInterScience、SpringerLINK)的检索,在1997~2007年这一时间段检索出70多篇有关相关性研究的外文文献,分析论文发表的时间分布发现,相关性研究在2003年前后以及2007年呈现出研究的高峰期(见图1)。对文章的关键词进行分析,在70篇文章当中总共含有354个关键词(其中有1篇文章没有关键词标引),其中关于相关反馈、查询扩展、相关性排名、检索效率等方面的研究是比较多的(见表1)。
?
?
?
?
2.2相关性的基础性研究
?
相关性(Relevance)一词在英语词典中解释为“therelationofsomethingtothematterath
您可能关注的文档
最近下载
- QB_T 4563-2013金砂糖.pdf
- 大坝安全监测系统运检导则(试行) QGDW 46 10022.24-2020.docx VIP
- 第五单元 一方水土养一方人 达标训练(含答案) 浙江省人教版七年级人文地理下册.docx
- 奋进新征程建功新时代PPT模板.ppt VIP
- 规范《GB712-88-船体用结构钢》.pdf
- 二年级上册语文教学设计21《狐假虎威》一等奖 刘芳 部编版.docx VIP
- Q_GDW 46 10022.25-2020 通风空调系统运检导则.docx
- 12如何帮助学生学会正确地与异性同学交往?.docx VIP
- 专题1.2 数轴与动点经典题型(四大题型)(原卷版).docx VIP
- 拉森钢板桩专项施工方案.doc
文档评论(0)