搜索引擎地产生背景.docVIP

  • 4
  • 0
  • 约1.08万字
  • 约 8页
  • 2018-12-09 发布于江苏
  • 举报
搜索引擎地产生背景

搜索引擎技术的理解认识 - PAGE 1 - 搜索引擎技术的产生背景 HYPERLINK /view/1154.htm搜索引擎是指根据一定的HYPERLINK /view/117922.htm策略、运用特定的HYPERLINK /view/178184.htm计算机程序从HYPERLINK /view/6825.htm互联网上搜集HYPERLINK /view/1527.htm信息,在对信息进行HYPERLINK /view/46944.htm组织和HYPERLINK /view/989420.htm处理后,为用户提供HYPERLINK /view/677662.htm检索服务,将用户检索相关的信息展示给用户的HYPERLINK /view/25302.htm系统。搜索引擎包括HYPERLINK /view/62889.htm全文索引、HYPERLINK /view/1487025.htm目录索引、HYPERLINK /view/7203.htm元搜索引擎、HYPERLINK /view/7491.htm垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。HYPERLINK /view/262.htm百度和HYPERLINK /view/1931.htm谷歌等是搜索引擎的代表 搜索引擎的发生背景在因特网发展初期,网站相对较少,新闻查找比较容易。然而随着新闻技术的飞速发展,特别是因特网应用的迅速普及,网站越来越多,并且每天全球互联网网页数目以千万级的数量增加。要在浩瀚的网络新闻中寻找所需要的材料无异于大海捞针。这时为满足人人新闻检索需求的搜索网站应运而生。 搜索引擎从发生到发展大概阅历履历了如下四个步骤: Archie的出现Archie已经具备了现代搜索引擎的雏形。1990年,加拿大蒙特利尔大学艾伦伊米杰等三个学生在查询文件的时候感触非常不便,当时需要到散布在各个地方的FIP主机中去搜索,于是他们三人开发了用文件称号查找文件体例的想法。经过精心设计,终于开发出了Archie程序。Archie是第一个自动搜索互联网上匿名FTP网站文件的程序。Archie是一个可搜索的FTP文件称号排列表,当用户输入精确的文件称号时,Archie会告诉用户哪一个FTP地址可以下载该文件。Archie还不是真正的搜索引擎,只是实现了自动索引互联网上匿名FIP网站文件的技术,但无疑是在搜索引擎技术发展上迈出的第一步。 Spider的出现为搜索引擎的发展奠定了基础,由于特地用于检索新闻的机器人(Robot)程序像蜘蛛(Spider)一样在网络间爬来爬去,因此,Robot程序又被称之为Spider程序。世界上第一个Spider程序,是由1993年6月美国麻省理工学院学生马杰·杰瑞开发出来的,它可以用来捕捉互联网上的网址,追踪互联网发展规模。虽然它也还不是真正意义上的搜索引擎,但Wanderer的原理与技术已经被今天的搜索引擎广泛采用。随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在www Wanderer基础上,一些编程者将传统的spider程序工作原理作了些改进。其原理是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,优化。就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷繁涌现,其中以 Jumpstinsideion、TheWorldWideWebWorm(Goto的前身, 也就是今天Overture), 和Repository—BasedSoftware Engineering(RBSE)最负盈盛名。然而Jumpstinsideion和wwwwo只是以搜索工具在数据库中找到匹配新闻的先后次序排列搜索结果,因此毫无新闻关联度可言。而RBSE是是第一个索引HTML文件正文的搜索引擎,是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。 Lycos的发明Lycos(CarnegieMellonUniversityCenter forMac^ine Translinsideion Announces Lycos)是搜索引擎史上又一个重要的进步。CarnegieMellonUniversity的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。同时期的Infoseek(Steve Kirsch AnnouncesFree Demos Of the Infoseek SearchEngine)是另一个重要的搜索引擎。起初

文档评论(0)

1亿VIP精品文档

相关文档