(精选)网络信息检索:检索原理和搜索引擎课件.ppt

(精选)网络信息检索:检索原理和搜索引擎课件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
演示文稿演讲PPT学习教学课件医学文件教学培训课件

第二章 检索原理和 搜索引擎;本章内容;第一节 信息检索原理: 关键词匹配原则;广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程。 ;存 储;4、信息检索原理;What? Where? How?;6、信息检索类型;7、主要计算机检索系统类型;8、“关键词原则”是信息检索的根本原则;第二节 搜索引擎的原理和发展概况;1、网络信息资源种类;2、网络信息资源的特点;搜索引擎 Search Engine;4、搜索引擎的发展历史;搜索引擎发展历史;搜索引擎的起源——Archie; 由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。 现在这个工具主要用在国外大型图书馆的信息检索上。; 1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和David Filo共同创办了Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。Yahoo!---几乎成为20世纪90年代的因特网的代名词。; 1995年,一种新的搜索引擎形式出现了——元搜索引擎(Meta Search Engine)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。 第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。 ;第三代搜索:网页搜索;5、搜索引擎的工作原理;; 搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 搜索引擎至少由三部分组成: 爬行器(即机器人、蜘蛛等搜索程序) 索引生成器(即网页索引数据库) 查询检索器(即用户检索界面) 随着搜索引擎的发展,许多搜索引擎在此基础上增加特色功能。如百度增加了监控程序。;搜索引擎的工作原理就像超市; 利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。 ;第二步:建立索引数据库; 搜索引擎的Spider一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页内容的更新情况,增加新的网页信息,去除死链接,并根据网页内容和链接关系的变化重新排序。这样,网页的具体内容和变化情况就会反映到用户查询的结果中。 ;第三步:检索界面的建立; 每个搜索引擎都必须向用户提供一个良好的信息查询界面,一般包括分类目录及关键词两种信息查询途径。;;;第三节 两类搜索引擎及 网页搜索引擎;两类搜索引擎的代表;第一类搜索引擎: 网页搜索引擎 以谷歌和百度为代表;1、Google搜索引擎 ;Google 简介:;Google 简介:;注意用“ ”与*功能;;谷歌其他功能;2、百度(baidu);; 一、概况 百度(B,Inc)于1999年底 成立于美国硅谷,2000年,落户中国。 2001年8月,发布B搜索引擎Beta版,从后台服务转向独立提供搜索服务,并且在中国首创了竞价排名商业模式。 2001年10月22日正式发布Baidu搜索引擎。 2005年8月5日,百度在美国纳斯达克上市。; “百度”二字取自辛弃疾的《青玉案》 “众里寻她千百度” 。 现在百度已成为世界上最大的中文搜索引擎。用户能够访问超过6亿的中文网页,5000多万张图片、500多万首中文mp3及各种格式的音乐。 ;;? 北京正望咨询有限公司;百度 VS Google; 目标信息一定含有的关键字:用双引号连起来 目标信息不能含有的关键字:用“ - ”去掉 目标信息可能含有的关键字:用“OR”或空格连

文档评论(0)

youngyu0329 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档