网站大量收购独家精品文档,联系QQ:2885784924

把 Google 数据存在打孔卡上.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
把 Google 的数据存在打孔卡上 提问:如果所有的数据都用打孔卡存起来,那么 Google 的数据中心将有多大? -- James Zetlen 小编先在这里介绍一下「打孔卡」这个老怪物: 打孔卡,也叫「穿孔卡」(IBM 卡),利用卡纸上打孔来记录信息。它看上去就是这个样子: 这是一枚80列的标准矩形 IBM 打孔卡。 这里牵涉到一段计算机诞生的前史。要说现在计算机的老祖宗,严格来讲不是教科书上大名鼎鼎的 ENIAC,而是1801年,法国人雅卡尔发明的织布机: 看到它上门一条打孔纸了么,这可是世界上最早的「可编程机器」,这些孔洞记录了要编制图案花纹。 后来在1880年代美国,美国用打孔数据机完成了全美人口普查。而制造这些机器的这家公司,就是后来的 IBM。1890年到20世纪初期,这种打孔数据记录的方式,一直广泛沿用在商业领域,和计算机编程上。 (via 维基百科) 几乎可以肯定的是,Google 拥有比地球上所有其他机构更强大的数据存储能力。 Google 对于他们的运维细节守口如瓶,所以我也很难确定数据中心的具体的数字。只有少数机构拥有可信的大型数据存储设施。比如以下几家特别厉害的: ·?NSA(美国国家安全局,最近比较衰) ·?NRO(美国国家侦查局,不太出名,管间谍卫星) ·?NGA(美国国家地理空间情报局,不太出名) ·?CIA(中央情报局,电影里总是出来给主人公捣乱的) ·?Schlumberger(斯伦贝谢,石油勘探技术公司) ·?Tencent(腾讯,珠宝商) ·?Chevron(雪佛龙,石油公司) 我们还要荣誉提名这些: ·?Amazon(它们真的很大,但未必有 Google 大) ·?Facebook(它们正在变大的道路上,而且速度很快,但还需努力) ·?Microsoft(它们有百万台以上的服务器(鲍尔默自己说的),但是没人知道他们要这么多服务器干嘛) 以钱推算 我们先通过钱数,来推算 Google 有多少数据中心。Google 在基建上的开销——加起来大概超过120亿美金。最大的一个数据中心花掉了大概5~10亿美金。所以,他们不会拥有超过20个这样的数据中心。 在 Google 的网页上提到了它们在以下几处建造了数据中心: · 南加州的伯克利郊区 · 爱荷华州的康瑟尔布拉夫斯 · 佐治亚州的亚特兰大 · 北卡罗来纳州的勒诺 · 俄勒冈州的达尔斯 · 中国香港 · 新加坡 · 中国台湾 · 芬兰哈米那 · 比利时的圣吉兰 · 爱尔兰的都柏林 · 智利的基利库拉 另外,Google 还控制着其他一些大型数据中心(通过附属公司)。 · 荷兰的埃姆斯哈文 · 荷兰的格罗宁根 · 波兰的弗罗茨瓦夫 · 弗吉尼亚的雷斯顿 · 还有在佐治亚州亚特兰大的一些数据中心 · 还有更多遍布世界的上百个小型数据中心。 依耗电量推算 搞明白 Google 有多少数据中心,还可以看看它们的耗电量。不幸的是,我们不能直接去中心看电表的走字。我们只能自己挖点料。 在2010年,Google 透露了他们一年要耗费 258 兆瓦的电力。这能跑多少服务器呢? 我们知道 Google 的数据中心还是很省电的,用在散热和其他方面的开销只占总用电量的10%~20%。为了解每台服务器的耗电量,我们研究一下他们2005年提出的「集装箱数据中心」的概念。虽然不是很清楚他们具体如何利用这些货柜——可能现在看来已经有点过时,但可以从中估计出一个合理的数字,答案是每台215瓦。 由此推算出,他们在2010年大概运行着100万台服务器。 基于数据中心的耗电量和开销,我猜 Google 现在运行着的——或者马上就要达到的服务器总数,在 180万~240万台左右。 但是「服务器」究竟指什么?Google 可能弄出各种配置的各种奇葩装备,可能一台有100核的 CPU,还挂着100个硬盘。我们假设每台服务器上平均挂着几个(2~5个)2T 的硬盘,那总共就是 10EB(艾字节 exabytes) 的数据量。 只有 10EB ? 地球上的商用硬盘厂,一年大概造出 8EB 的硬盘。但是这个数字不包括像 Google 这样的公司,但无论如何,Google 吞掉了一大块硬盘消耗量。 让事情听上去更带劲一点,就 Google 用掉的这么多硬盘,平均每分钟就要挂掉一个。但这对 Google 来说,根本就算什么事儿,在它们这个体量级别的大背景下,Google 的 IT 小哥换硬盘的本事已经炉火纯青——不过,我也好奇, Google 程序猿是怎么看待当他们在一台机器上跑代码,分分钟可能碰到硬盘事故的。 磁带上的 Google 当然,以上只涵盖了滚烫在线干活的硬盘。谁知道在 Google 的地下室还有多少冷冰冰的磁带机备份呢? 在2011年一次与 博客 SMB Tech 的作者

文档评论(0)

187****5045 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档