- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
云计算的三架马车_Google_亚马逊与IBM.pdf
计算机世界/2008 年/5 月/12 日/第038 版
新知
云计算的三架马车:Google、亚马逊和IBM
清华大学 陈康 郑纬民
云计算作为一种新型的计算模式,还处于早期发展阶段。众多大小不一、类型各异的提供商
提供了各自基于云计算的应用服务。本文通过介绍亚马逊、Google、IBM 这三种典型的云计算实
现,为读者剖析在“云计算”背后所采用的具体技术,解析当前云计算的平台建设方法以及应用
构建方式。
实例1:
Google 的云计算平台与应用
Google 的云计算技术实际上是针对Google 特定的网络应用程序而定制的。针对内部网络数
据规模超大的特点,Google 提出了一整套基于分布式并行集群方式的基础架构,利用软件的能力
来处理集群中经常发生的节点失效问题。
从2003 年开始,Google 连续几年在计算机系统研究领域的最顶级会议与杂志上发表论文,
揭示其内部的分布式数据处理方法,向外界展示其使用的云计算核心技术。从其近几年发表的论
文来看,Google 使用的云计算基础架构模式包括四个相互独立又紧密结合在一起的系统。包括
Google 建立在集群之上的文件系统 Google File System ,针对 Google 应用程序的特点提出的
Map/Reduce 编程模式,分布式的锁机制Chubby 以及Google 开发的模型简化的大规模分布式数
据库BigTable 。
Google File System 文件系统
为了满足Google 迅速增长的数据处理需求,Google 设计并实现了Google 文件系统(GFS ,
Google File System )。GFS 与过去的分布式文件系统拥有许多相同的目标,例如性能、可伸缩性、
可靠性以及可用性。然而,它的设计还受到 Google 应用负载和技术环境的影响。主要体现在以
下四个方面:
1. 集群中的节点失效是一种常态,而不是一种异常。由于参与运算与处理的节点数目非常庞
大,通常会使用上千个节点进行共同计算,因此,每时每刻总会有节点处在失效状态。需要通过
软件程序模块,监视系统的动态运行状况,侦测错误,并且将容错以及自动恢复系统集成在系统
中。
2. Google 系统中的文件大小与通常文件系统中的文件大小概念不一样,文件大小通常以G 字
节计。另外文件系统中的文件含义与通常文件不同,一个大文件可能包含大量数目的通常意义上
的小文件。所以,设计预期和参数,例如I/O 操作和块尺寸都要重新考虑。
3. Google 文件系统中的文件读写模式和传统的文件系统不同。在Google 应用(如搜索)中
对大部分文件的修改,不是覆盖原有数据,而是在文件尾追加新数据。对文件的随机写是几乎不
存在的。对于这类巨大文件的访问模式,客户端对数据块缓存失去了意义,追加操作成为性能优
化和原子性(把一个事务看做是一个程序。它要么被完整地执行,要么完全不执行)保证的焦点。
4. 文件系统的某些具体操作不再透明,而且需要应用程序的协助完成,应用程序和文件系统
API 的协同设计提高了整个系统的灵活性。例如,放松了对GFS 一致性模型的要求,这样不用加
重应用程序的负担,就大大简化了文件系统的设计。还引入了原子性的追加操作,这样多个客户
端同时进行追加的时候,就不需要额外的同步操作了。
总之,GFS 是为Google 应用程序本身而设计的。据称,Google 已经部署了许多GFS 集群。
有的集群拥有超过1000 个存储节点,超过300T 的硬盘空间,被不同机器上的数百个客户端连续
第1 页 共8 页
不断地频繁访问着。
图1 给出了Google File System 的系统架构,一个GFS 集群包含一个主服务器和多个块服务
器,被多个客户端访问。文件被分割成固定尺寸的块。在每个块创建的时候,服务器分配给它一
个不变的、全球惟一的64 位块句柄对它进行标识。块服务器把块作为linux 文件保存在本地硬盘
上,并根据指定的块句柄和字节范围来读写块数据。为了保证可靠性,每个块都会复制到多个块
服务器上,缺省保存三个备份。主服务器管理文件系统所有的元数据,包括名字空间、访问控制
信息和文件到块的映射信息,以及块
您可能关注的文档
- 丹化化工科技股份有限公司.pdf
- 为中科院植生所提供服务拟南芥2d.pdf
- 为啥不同调变其灵敏度会不同.pdf
- 为自己梦想而奋斗.ppt
- 主动信息服务和其系统设计研究.pdf
- 主要用材树种名称和误导名、原产地介绍.doc
- 主观题作业(自动控制原理.doc
- 主题4教学资源的集成和整合.ppt
- 主题班会课件:我和祖国共奋进.ppt
- 义马砌体施工方案20111028.doc
- 2025至2030中国移动治疗台行业发展研究与产业战略规划分析评估报告.docx
- 2025至2030链激酶行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030爆炸物探测扫描仪行业市场占有率及有效策略与实施路径评估报告.docx
- 2025至2030四川省智能制造行业细分市场及应用领域与趋势展望研究报告.docx
- 2026届高三二轮复习试题政治大单元突破练1生产资料所有制与分配制度含解析.docx
- 2026届高三二轮复习试题政治大单元突破练16哲学基本思想与辩证唯物论含解析.docx
- 2026届高三二轮复习试题政治大单元突破练2社会主义市场经济体制含解析.docx
- 浙江省衢州市五校联盟2025-2026学年高二上学期期中联考技术试题-高中信息技术含解析.docx
- 浙江省金丽衢十二校2026届高三上学期11月联考政治试题含解析.docx
- 2026届高三二轮复习试题政治大单元突破练7领导力量:中国共产党的领导含解析.docx
原创力文档


文档评论(0)