搜索引擎的产生背景搜索引擎的产生背景.doc

搜索引擎的产生背景搜索引擎的产生背景.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
搜索引擎的产生背景搜索引擎的产生背景

搜索引擎技术的产生背景 HYPERLINK /view/1154.htm搜索引擎是指根据一定的HYPERLINK /view/117922.htm策略、运用特定的HYPERLINK /view/178184.htm计算机程序从HYPERLINK /view/6825.htm互联网上搜集HYPERLINK /view/1527.htm信息,在对信息进行HYPERLINK /view/46944.htm组织和HYPERLINK /view/989420.htm处理后,为用户提供HYPERLINK /view/677662.htm检索服务,将用户检索相关的信息展示给用户的HYPERLINK /view/25302.htm系统。搜索引擎包括HYPERLINK /view/62889.htm全文索引、HYPERLINK /view/1487025.htm目录索引、HYPERLINK /view/7203.htm元搜索引擎、HYPERLINK /view/7491.htm垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。HYPERLINK /view/262.htm百度和HYPERLINK /view/1931.htm谷歌等是搜索引擎的代表 搜索引擎的发生背景在因特网发展初期,网站相对较少,新闻查找比较容易。然而随着新闻技术的飞速发展,特别是因特网应用的迅速普及,网站越来越多,并且每天全球互联网网页数目以千万级的数量增加。要在浩瀚的网络新闻中寻找所需要的材料无异于大海捞针。这时为满足人人新闻检索需求的搜索网站应运而生。 搜索引擎从发生到发展大概阅历履历了如下四个步骤: Archie的出现Archie已经具备了现代搜索引擎的雏形。1990年,加拿大蒙特利尔大学艾伦伊米杰等三个学生在查询文件的时候感触非常不便,当时需要到散布在各个地方的FIP主机中去搜索,于是他们三人开发了用文件称号查找文件体例的想法。经过精心设计,终于开发出了Archie程序。Archie是第一个自动搜索互联网上匿名FTP网站文件的程序。Archie是一个可搜索的FTP文件称号排列表,当用户输入精确的文件称号时,Archie会告诉用户哪一个FTP地址可以下载该文件。Archie还不是真正的搜索引擎,只是实现了自动索引互联网上匿名FIP网站文件的技术,但无疑是在搜索引擎技术发展上迈出的第一步。 Spider的出现为搜索引擎的发展奠定了基础,由于特地用于检索新闻的机器人(Robot)程序像蜘蛛(Spider)一样在网络间爬来爬去,因此,Robot程序又被称之为Spider程序。世界上第一个Spider程序,是由1993年6月美国麻省理工学院学生马杰·杰瑞开发出来的,它可以用来捕捉互联网上的网址,追踪互联网发展规模。虽然它也还不是真正意义上的搜索引擎,但Wanderer的原理与技术已经被今天的搜索引擎广泛采用。随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在www Wanderer基础上,一些编程者将传统的spider程序工作原理作了些改进。其原理是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,优化。就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷繁涌现,其中以 Jumpstinsideion、TheWorldWideWebWorm(Goto的前身, 也就是今天Overture), 和Repository—BasedSoftware Engineering(RBSE)最负盈盛名。然而Jumpstinsideion和wwwwo只是以搜索工具在数据库中找到匹配新闻的先后次序排列搜索结果,因此毫无新闻关联度可言。而RBSE是是第一个索引HTML文件正文的搜索引擎,是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。 Lycos的发明Lycos(CarnegieMellonUniversityCenter forMac^ine Translinsideion Announces Lycos)是搜索引擎史上又一个重要的进步。CarnegieMellonUniversity的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。同时期的Infoseek(Steve Kirsch AnnouncesFree Demos Of the Infoseek SearchEngine)是另一个重要的搜

文档评论(0)

cduutang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档