- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
搜索引擎的原理和发展概况;1、网络信息资源种类;2、网络信息资源的特点;搜索引擎是对Internet信息资源进行搜集、整理、分类和建立索引,然后供用户查询的系统。它是一类运行特殊程序的、专用于帮助用户查询WWW服务器上信息的Web站点。
搜索引擎周期性地在Internet上收集新的信息,并将其分类存储,这样在搜索引擎所在的计算机上,就建立了一个不断更新的数据库。用户搜索特定信息时,实际上是借助搜索引擎在这个数据库中进行查找。;4、搜索引擎的发展历史;搜索引擎发展历史;搜索引擎的起源——Archie; 由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica。Jughead是后来另一个Gopher搜索工具。
现在这个工具主要用在国外大型图书馆的信息检索上。; 1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和David Filo共同创办了Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。Yahoo!---几乎成为20世纪90年代的因特网的代名词。; 1995年,一种新的搜索引擎形式出现了——元搜索引擎(Meta Search Engine)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。
第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler研发的。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。 ;第三代搜索:网页搜索;5、搜索引擎的工作原理;;搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。
搜索引擎至少由三部分组成:
爬行器(即机器人、蜘蛛等搜索程序)
索引生成器(即网页索引数据库)
查询检索器(即用户检索界面)
随着搜索引擎的发展,许多搜索引擎在此基础上增加特色功能。如百度增加了监控程序。;搜索引擎的工作原理就像超市; 利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。;第二步:建立索引数据库; 搜索引擎的Spider一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页内容的更新情况,增加新的网页信息,去除死链接,并根据网页内容和链接关系的变化重新排序。这样,网页的具体内容和变化情况就会反映到用户查询的结果中。 ;第三步:检索界面的建立; 每个搜索引擎都必须向用户提供一个良好的信息查询界面,一般包括分类目录及关键词两种信息查询途径。;;;两类搜索引擎及网页搜索引擎;两类搜索引擎的代表;第一类搜索引擎:网页搜索引擎以谷歌和百度为代表;1、Google搜索引擎 ;Google 简介:;Google 简介:;;Google 技术;Google的特殊功能(部分);网页快照:Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”后,将看到 Google 将该网页编入索引时的页面。Google 依据这些快照来分析网页是否符合您的需求。(不好用)
类似网页 :如果你对某一网站的内容很感兴趣,但又嫌资料不够,单击“类似网页” Google 会帮你找到其他有类似资料的网站;;按链接搜索:查询 “link:” 显示所有指向该网址的网页。例如,“link:”将找出所有指向 网易主页的网页。
手气不错:按下“手气不错?”按钮将自动进入 Google 查询到的第一个网页。
指定网域:如果要在某个特定的域或站点中进行搜索时可输入“*** site:***.com”。如在新浪网中搜索“新闻”可输入“新闻 site:”
;其它技巧;;谷歌其他功能;2、百度(baidu);; 一、概况
百度(B,Inc)于1999年底
成立于美国硅谷,2000年,落户中国。
2001年8月,发布B搜索引擎Beta版,从后台服务转向独立提供搜索服务,并且在中国首创了竞价排名商业模式。
2001年10月22日正式发布Baidu搜索引擎。
2005年8月5日,百度在美国纳
文档评论(0)