信息检索及发展.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第7章信息检索及发展《现代信息查询与利用》课程组

7.1信息检索概述7.2信息检索研究历史和现状7.3信息检索模型

7.1.1信息检索词汇(terms)检索的含义?“检索就是查找”,这仅仅是一种狭义的解释。从广义的角度讲,检索包括“存贮”和“查找”两个过程。没有存贮就没有查找,存贮是为了查找,但查找必须有存贮,两者缺一不可。?

信息检索词汇(terms)“检索”(Retrieval)一词是一个外来词,来源于英语“Information?Retrieval”(信息检索)Informationretrieval(IR)Informationaccess(obtain)Informationsearch(lookfor)Informationsearching(lookfor)Informationseeking(focusonusers,active)locatehit

信息检索的原理01信息检索?是指从任何信息集合中查出所需信息的活动、过程与方法。广义的信息检索还包括信息存贮,两者又往往合并称为“信息存贮与检索(Information?storage?and?retrieval)。02

信息检索的原理信息存贮与检索

信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时情报检索系统信息检索的起源

网络化(networked)智能化(intelligentized)计算机化(computerized)认知化(cognized)手工操作(manual)信息检索发展阶段要检索系统类型联机检索(onlinesearch)脱机检索(offlinesearch)光盘检索(CDsearch)网络检索(Interne/Websearch)全球数字图书馆系统(digitalglobalsystem)

1、联机检索(onlinesearch)通信网络联机检索中心检索终端数据库主机WAN微机

检索终端01局域网02服务器03光驱04LAN05微机06光盘联机检索(CDonline)07

网络(Internet)信息检索Internet网络检索分布、开放、异种机;客户机/服务器模式,浏览器/服务器模式信息量大,无质量控制;自动发掘、采集;免费服务居多个人用户检索模式;WIMP(浏览+检索);自然语言检索为主

1948年C.N.Mooers在其MIT硕士论文中第一次使用了“InformationRetrieval”这个术语011960-70年代在建立文摘检索系统中,产生了布尔模型(BooleanModel)、向量空间模型(VectorSpaceModel)和概率检索模型(ProbabilisticModel)02研究历史和现状7.2信息检索研究历史和现状

1990’s第一个网络搜索工具:1990年加拿大蒙特利尔大学开发的FTP搜索工具Archie1980年代出现商用数据库检索系统:Dialog,ORBIT,MEDLINE研究历史和现状7.2信息检索研究历史和现状

7.2信息检索研究历史和现状研究历史和现状第一个WEB搜索引擎:1994年美国CMU开发的Lycos1995斯坦福大学博士生开发Yahoo1998斯坦福大学博士生开发的Google,提出PageRank计算公式1998年基于语言模型的IR模型提出

文本分类和聚类的使用、信息抽取:Whizbang1990年代推荐系统的出现:Ringo,Amazon,NetPerceptions研究历史和现状7.2信息检索研究历史和现状

7.2信息检索研究历史和现状研究历史和现状2000’s的重要事件文本检索会议TREC(TextRetrievalConference)的发展问答系统评测专项Q/Atrack(QuestionAnsweringTrack)2001年,百度成立

研究历史和现状2000’s以来的其他重要事件多媒体IR,Image,Video,Audioandmusic跨语言IR,DARPATides,文本摘要,DUC评测7.2信息检索研究历史和现状

检索模型三类基于内容的信息检索模型结构化模型浏览型数学模型

检索模型分类信息检索模型检索模型浏览模型内容模型结构模型布尔模型向量模型概率模型非重叠链表模型邻近节点模型平坦模型结构导向模型超文本模型

01基于内容的信息检索模型有集合论模型03向量空间

文档评论(0)

yingyaojun1975 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档