- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
google第一个IT项目
Google第一个IT项目——Google搜索引擎 适用班级: J信息08 lll 指导老师: 樊茗玥 * . Google的起源 1995年,俄罗斯人Sergey Brin 在美国斯坦福大学新一届博士生的聚会中,偶然遇到密歇根大学毕业的Larry Page ,两人都是电脑科学系(Computer Science)的毕业生。当时他们不但没有一见如故,反而对每个话题都坚持自己的一套看法。直到二人找到一项共同的挑战:如何在浩瀚的互联网信息中提取相关的资料? 在往后的两年(即1996-1997年),Brin和Page为解决这个难题,开发出一款名为BackRub的搜索引擎(Google前身)。1998年,他们听从一位师兄David Filo(Yahoo!创办人之一,另一位是杨致远)的建议,成立了自己的公司,而Google同时亦以测试版(Beta)现身互联网。 * Google的起源 其后所发生的事情,今天看来可以说是“理所当然”。正如历代极具影响力的网站一样,Google爆发出强大的凝聚力,从当时每日处理10000次搜寻,火速升到2003年的200,000,000次。凭借它准确的搜寻功能,Google现在已成为最受欢迎的网络搜索引擎。 * Google工作的基本原理 工作原理 (一)搜集资讯:搜索引擎靠机器人程式 (spider)处理网站资料的收录工作 (二)整理资讯:搜索引擎整理资讯的过程 称为「建立索引」,搜索引擎不仅要 保存搜集起來的资讯,还要將它们按 照一定的规则进行编排 (三)接受查询:用戶向搜索引擎发出查询, 搜索引擎接受查询并向用戶返回资料 * Google 运作原理实例(一) 网页标题 和连接数 据存在一 个索引 中,用于 宽泛竞争 激烈的 搜索 当你通过Google搜索时,不是搜索实现的 网络,而是搜索Google的不断更新的 你写了篇博客,发了个评论,对 网站进行了更新或者添 加内容到网上 Google的网络蜘蛛爬取整个网络, 包括你发布的内容 一旦爬取后,页面会在几秒内被 索引 Google还可以通过博客的ping命令或者 Xml sitemap来找到你的网站 从高权威性的网站获得越多外链, 则这些网页获得越高的权威性 如果到你网站的外链有nofollow标签, Google不会通过这些连接爬取你的 网站 如果你通过robot.txt告诉Google别 爬取的网站,Google将不会爬取 Google网络蜘蛛跟随连接进行爬取, 如果你得网站没有外链,那么你的 网站不会进行常规和深度爬取 爬取没有nofollow标签的连接 网页内容存储在一个逆索引 (reverse index)中 网页内容 存在另外 一个索引 中,用于 不常见或 长尾关键 字的搜索 * Google 运作原理实例(二) 用户使用Google搜索 Google根据用户键入的字母或 词语提供关键字建议 Google将相似的同义词包含在 查询中 产生初步的搜索结果 Google可能会找到超过百万 的搜索结果,但最终显示出 来的可能只有1000条 (或少于1000条) 搜索结果本地化:本地网站在 搜索结果中将被优先推介 * Google 运作原理实例(二) 用户使用Google搜索 Google根据用户键入的字母或 词语提供关键字建议 Google将相似的同义词包含在 查询中 产生初步的搜索结果 Google可能会找到超过百万 的搜索结果,但最终显示出 来的可能只有1000条 (或少于1000条) 搜索结果本地化:本地网站在 搜索结果中将被优先推介 * Google 运作原理实例(三) Google根据连接评估域名和网页 总体的权威性 网页根据编辑政策被再次检查 同时网页被分割成很多数据块, 用户搜索时将使用这些数据 Google的搜索质量团队和反垃圾 团队反复评估和完善算法 1万远程测试者对他们的搜索 质量进行评分 Google根据DMCA的通知剔除 侵权的内容 Google根据DMCA的通知剔除 侵权的内容 * Google发展结果 1999年6月7日,绝对是历史性的一天。因为,这一天硅谷最有名的两家风险投资公司克莱那·巴金斯和美洲杉都同意向Google一共投资 2500万美元。两家公司的两大人物美洲杉的 Mike Moritz 和克莱那·巴金斯公司的约翰·杜尔同时进驻公司的董事会。从此,标志着 Google不再是一家车库公司,而成为互联网大潮中正式 的玩家之一。 但是,到了 2001 年,Google 面临发展危险,需要一个更严格的公司结构体系,一位业界高手。这就是埃里
文档评论(0)