- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
传染病护理_肖云武_阿米巴病
* * * * * * 云计算发展的推动力 挑战旧体系的创新动力 互联网经济的形成 IT成本控制的要求 IT服务质量与服务交付速度的要求 带宽不再是障碍 分布式计算、集群技术、虚拟化技术等关键技术的逐渐成熟 专业化分工的趋势 云计算 云计算特征总结 EC2 S3 Cloud Computing: “这是一种计算方式,它能将大量灵活弹性的IT相关能力打包成服务提供给使用互联网技术的外部客户 “重要的是结果.我不关心它是如何做的. “我不想支付固定投入成本,我更愿意支付弹性使用费,就像用电一样. “这带来了规模经济性,效率和动态共享. 采集模式 服务 商业模式 按需计费 技术模式 可扩展的,弹性的,可共享的 访问模式 互联网 “ 我想随时随地访问. * * * Jeff Bezos’ quote: /8301-13953_3-9977100-80.html?tag=mncol Kevin Marks quote: /8301-13953_3-9938949-80.html?tag=mncol video interview * * * * 它通过特定的网格软件,将一个庞大的项目分解为无数个相互独立的、不太相关的子任务,然后交由各个计算节点进行计算。即便某个节点出现问题,没有能够及时返回结果,也不影响整个项目的进程,甚至即便某一个计算节点突然崩溃,其所承担的计算任务也能够被任务调度系统分配给其他的节点继续完成。 应该说,从这一点来说,作业调度是网格计算的核心价值。 * * 共享资源不是差别,共享动态资源才是差别。 网格是问有没有空,而云计算是已经将资源切成小块了。 由不同机构共享资源,很多不是技术问题。 网格从共享高性能计算来的,容易实现。但不同单位要共享数据比较难。 网格是教授在搞,云计算是老板在搞。 * * * * * * * * * * * * * * * * * * * * * * * Large Scale Systems Architecture using MapReduce Hadoop架构 在Google发表MapReduce后,2004年开源社群用Java搭建出一套Hadoop框架,用于实现MapReduce 算法,能够把应用程序分割成许多很小的工作单元,每个单元可以在任何集群节点上执行或重复执行。 此外,Hadoop 还提供一个分布式文件系统GFS(Google file system),是一个可扩展、结构化、具备日志的分布式文件系统,支持大型、分布式大数据量的读写操作,其容错性较强。 而分布式数据库(BigTable)是一个有序、稀疏、多维度的映射表,有良好的伸缩性和高可用性,用来将数据存储或部署到各个计算节点上。 Hadoop 框架具有高容错性及对数据读写的高吞吐率,能自动处理失败节点,如图3-5所示为Google Hadoop架构。 在架构中MapReduce API提供Map和Reduce处理、GFS分布式文件系统和BigTable分布式数据库提供数据存取。基于Hadoop可以非常轻松和方便完成处理海量数据的分布式并行程序,并运行于大规模集群上。 Who Uses Hadoop? Amazon/A9 AOL Facebook Fox interactive media Google / IBM New York Times PowerSet (now Microsoft) Quantcast Rackspace/Mailtrust Veoh Yahoo! More at /hadoop/PoweredBy 特点 Hadoop的可靠性—— 它维护多个工作数据副本,在出现故障时可以对失败的节点重新分布处理。 Hadoop的高效性—— 并行工作的,以加快任务处理速度。 Hadoop的可扩展—— Hadoop的运算是可扩展的,具有处理PB级数据的能力。 基本架构 HDFS分布式文件系统 ( Hadoop Distributed File System ) HDFS 可以执行的操作有创建、删除、移 动或重命名文件等 Map/Reduce 引擎 Google云计算执行过程 云计算服务方式多种多样,通过对Google云计算架构及技术的理解,在此我们给出用户将要执行的程序或处理的问题提交云计算的平台Hadoop,其执行过程如下图所示: 如图所示的Google云计算执行过程包括以下步骤。 (1)将要执行的MPI程序复制到Hadoop框架中的Master和每一台Worker机器中。 (2)Master选择由哪些Worker机器来执行Map程序与Reduce程序。 (3)分配所有的数据区块到执行Map程序的Worker机器中进行Map(切割成小块
原创力文档


文档评论(0)