- 1
- 0
- 约4.03千字
- 约 28页
- 2016-04-09 发布于湖北
- 举报
* * * * * * 云 计 算 漫 谈 起源——Google集群 1997年,Google的两位创始人:拉里·佩奇(Larry Page,美国密西根)和谢尔盖·布林(Sergey Brin,美籍俄罗斯裔,犹太人),找Andy Bechtolsheim(SUM微系统创始人之一安迪.别赫托西姆)募集投资 Andy问,“你们打算做什么?” Larry和Sergey答,“打算把互联网上所有网页都下载,然后建一个搜索引擎。” Andy说, “把互联网上所有网页统统下载?!需要多大空间?几个Giga不行吧,几个Tera也不行吧?” Andy觉得这个项目不太靠谱,所以只给1百万美元。这么一点钱,如果去买高端的存储系统,显然不够。走投无路下,Larry和Sergey决定用便宜的PC机,组建一个集群。先凑合着用,等数据量增加,再购买更多的PCs,扩大集群的容量 短短几年Google就迅速发展成为目前规模最大的搜索引擎,并向雅虎、美国在线等其他搜索引擎提供后台网页查询服务 目前Google每天处理的搜索请求达2亿次,这一数字还在不断增长,搜索时间通常不到半秒钟 从这个故事,可以看到 Google集群,也就是Google云计算的核心 1 云计算要解决什么问题 Memorizer:大规模的存储空间,用于存储海量的数据 Scalability:随着业务的发展,新的数据源源不断地增加,存储空间需要相应扩大。用术语讲,这叫可扩展性 Cheap:系统的硬件设备必须便宜,通常使用PC Reliability:便宜的硬件设备,经常死机。所以在设计这个集群的时候,必须保证不能因为个别机器死机,导致整个系统的崩溃,即系统的稳定性要好 Distributed:把一个巨大的工作切成非常小的小块,用大量的服务器对它们同时进行运算 2 云计算的商业模式 Google的绝大多数收入来自于广告 Google的搜索结果精确:采用PageRank算法,基本思想:如果网页T存在一个指向网页A的连接,则表明T的所有者认为A比较重要,从而把T的一部分重要性得分赋予A。这个重要性得分值为:PR(T ) /C(T) 其中PR(T )为T的PageRank值,C(T)为T的出链数,则A的PageRank值为一系列类似于T的页面重要性得分值的累加 优点:是一个与查询无关的静态算法,所有网页的PageRank值通过离线计算获得;有效减少在线查询时的计算量,极大降低了查询响应时间 不足:人们的查询具有主题特征,PageRank忽略了主题相关性;另外,PageRank对新网页严重的歧视 Google独步天下的是它的集群 数据托管,企业不用建自己的数据中心,把数据存在Google集群里,每个月交点托管费 Google的应用服务很有人气,譬如Gmail、GTalk、Online docs、Google earth、YouTube等。这些服务对于个人用户是免费的;但是给企业用户使用,不是免费的 I choose my friends for their good looks, my acquaintances for their good characters, and my enemies for their good intellects. ——Oscar Wilde 3 Google云计算的矛头指向? IT长者说,“Google像一个阳光少年,一路顺风顺雨,张张扬扬。让人羡慕,招人喜欢。而微软像一个稳健的中年人,一路风吹雨打,过五关斩六将,毁誉参半。对于它的支持者而言,它是令人敬重的领袖,对于它的竞争者而言,它是令人敬重的对手,无论如何,微软是令人敬重的。” 1)Microsoft Outlook Google Gmail Microsoft outlook email系统的软肋,在于它的后台系统不够稳定,容量不易扩展。对于用户而言,经常会遇到联不上Outlook服务器,以及存储空间不够的麻烦 看准这两点,Google把Gmail的号召力定位在:1. 稳定性;2. 无限的存储空间 Google之所以敢于这么叫阵,本钱就在于云计算平台。当然微软也不甘示弱,它们反着力点在于保密性(Googler偷窥) 2)Microsoft Office Google Docs Microsoft office 产品的软肋:所有文件存放在本地电脑 Google Docs文本放在Google云计算平台上,无论是在办公室还是在家里,你都可以对同一份文本进行修改;你的同事可以共享这个文本,并进行修改 微软反着力点在于,Google Docs的所有操作都在浏览器里完成,所有功能都通过JavaScript实现。受制于JavaScri
原创力文档

文档评论(0)