【冷热冲击试验箱】被遗忘的互联网搜索引擎之父.doc

下载文档 降价啦

2
0
约 53页
2016-04-04 发布于江西
举报
版权申诉
保障服务

【冷热冲击试验箱】被遗忘的互联网搜索引擎之父.doc

1、本文档共53页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

被遗忘的互联网搜索引擎之父今年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词，但是互联网搜索引擎并非Google首创――早在20年前，英国年轻人乔纳森弗莱彻（Jonathon Fletcher）就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎，而这项技术是当今Google、必应、雅虎和其他各大搜索工具的基础。弗莱彻多年来一直默默无闻，就连他自己也没有意识到自己就是“互联网搜索引擎之父”，直到几年前有研究人员发现了他的成就。BB C日前对他进行了专门报道，以下为文章主要内容：首次触网在1993年，互联网刚刚对公众开放，第一款大受欢迎的Web浏览器Mosaic也刚刚问世――它的界面与我们如今使用的各种浏览器非常相似。在当时，全球总共只有数以千计的网页，如何在Web上查找信息是个有待解决的问题。 Mosaic有个“What’s New”（新鲜事）页面能对新建的网站加以索引，但网站创建者要想让Mosaic的开发者注意到自己的网站，就必须给Mosaic开发团队所在的伊利诺伊大学香槟分校（University of Illinois Urbana-Champaign）的美国国家超级计算机应用中心（NCSA）写信。那时候，乔纳森弗莱彻是斯特灵大学（University of Stirling）的一名研究生，正准备去格拉斯哥大学（University of Glasgow）攻读博士学位，前途一片光明。但是，弗莱彻还没去格拉斯哥大学，那边的科研项目经费就被砍了，于是他一下子无事可做了。迫于生计，他回到斯特灵大学找了一份技术类工作――正是这份工作，让他首次接触万维网和Mosaic的“What’s New”页面。改进索引在为斯特灵大学构建一台Web服务器时，弗莱彻意识到“What’s New”页面存在重大缺陷――网站都是人工添加至列表的，因此网站内容变化是无法追踪的，于是很多链接会很快过时或者被加上错误的标签。如果想知道网站内容有何变化，就只能回到网站上查看一番。弗莱彻觉得一定有更好的方法，于是他决定发挥计算机专业科班出身的特长、写点能帮自己查找信息的东西――这个东西，其实就是世界上第一个Web爬虫软件。弗莱彻给自己的发明取名“JumpStation”。他汇总出一个能被Web爬虫软件搜索的网页索引，而爬虫会访问它遇到的每一个网页上的每一个连接并对它们建立索引――整个流程自动进行，直到爬虫没有东西可访问为止。 10天之后，也就是在1993年12月21日，JumpStation没有东西可以访问了。此时，它已经对2.5万个网页建立了索引。而今天，谷歌已经对超过1万亿个页面建立了索引。引擎问世弗莱彻很快为网页索引建立了一个容易操作的搜索工具，然后把自己的网站放在了Mosaic的“What’s New”页面上――世界上第一个现代化的搜索引擎就这样运行起来了。澳大利亚皇家墨尔本理工大学（RMIT）的马克桑德森（Mark Sanderson）教授是一位研究信息检索历史的学者，他认为弗莱彻是“Web搜索引擎之父”。桑德森指出，虽然电脑上的搜索技术早已有之，但弗莱彻是创造现代搜索引擎雏形的第一人。但是，谷歌创始人谢尔盖布林（Sergey Brin）和拉里佩奇（Larry Page）的名字早已家喻户晓，如今生活在香港的弗莱彻却默默无闻，没什么人知道他对互联网发展的贡献。 JumpStation越做越大，需要的投资也越来越多――后来斯特灵大学就不愿继续为它提供资金了。“它在一台共用服务器上运行，磁盘空间并不充裕，而且那时候的磁盘又小又贵。”弗莱彻解释道。无奈放弃到了1994年6月，JumpStation已经对27.5个网页建立了索引。迫于空间限制，弗莱彻只能给网页标题和导语建立索引，而无法顾及全部网页内容，但是尽管如此，JumpStation还是不堪重负。不堪重负的还有弗莱彻――毕竟，他的本职工作是维护实验室、管理系统和处理技术方面的琐事，不是运作JumpStation。后来，他有了一个去东京工作的好机会，而斯特灵大学也没有对他和他的JumpStation多做挽留。“我显然没能成功说服他们相信它的潜力。”弗莱彻说道，“在当时，我做了我认为正确的事情；但是这20年来，我也曾多次回想起昔日时光。” 斯特灵大学计算机科学与数学学院的院长莱斯利史密斯（Leslie Smith）教授向BBC表示，他记得弗莱彻和“超前问世”的JumpStation。他还表示，斯特灵大学的同事们对弗莱彻的成就开始被世人所知深感欣慰。展望未来弗莱彻虽然并不如意，但是他开创的技术为后来所有的Web搜索引擎奠定了基础。