- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2012/09/16 提纲 什么是云计算? 什么是Hadoop? Hadoop的基本组成 什么是云计算?(1/5) 当前软件的获取-使用的主要方式 离线方式: 购买---安装---本地运行使用 在线方式: 寻找---下载---安装---本地运行使用 什么是云计算?(2/5) 云计算环境下的软件获取-使用方式 在线寻找---在线运行---在线使用---在线付费 WebQQ 360在线杀毒 什么是云计算?(3/5) 云计算的定义 云计算是一种基于互联网的服务交付和使用模式,是指通过网络以按需、易扩展的方式获得所需服务。 核心思想:将大量用网络连接起来的计算资源统一管理和调度,构成一个资源池向用户提供按需服务。 为什么称为“云”计算: 以云可大可小、可以飘来飘去的这些特点来形容云计算中服务能力和信息资源的伸缩性和后台服务设施的位置透明性。 什么是云计算?(4/5) 云计算的应用模式 什么是云计算?(5/5) 云计算的优势 降低成本,提高效能 提供可靠、安全的数据存储 降低对用户端设备配置要求 轻松实现不同设备间的数据与应用共享 什么是Hadoop? hadoop 什么是Hadoop? Hadoop是一个开源的、可以编写和运行分布式应用来处理大规模数据的框架(平台)。 主要特点: 用户可以在不了解分布式底层细节的情况下,开发分布式程序 充分利用集群的威力高速运算和存储 Hadoop的基本组成 HDFS(Hadoop Distributed File System): 分布式文件系统,实现分布式存储 MapReduce:分布式程序框架,实现分布式计算 Hadoop的基本理念 输入的大规模数据 分布式计算代码 第一步:分布式存储,分配数据到各个节点 HDFS 第二步:分布式计算,分配代码到各个节点 MapReduce 基本理念: 代码向数据迁移 HDFS架构(主从架构) NameNode DataNode DataNode DataNode 客户端 Secondary NameNode 查询数据,获取数据位置 读写数据 TCP/IP TCP/IP TCP/IP TCP/IP MapReduce程序框架 Map函数:键/值对映射 k1, v1 ? k2,v2 E.g., k1, v1 : 1,“abcd”, 2,“cde”, 3,“acd”,….. k2,v2: ‘a’, 2, ‘b’,1, ‘c’,3,…… Reduce函数:规约 k2, list(v2) ? k3,v3 E.g., k2, list(v2) : ‘a’, list(1,2,3) k3,v3: ‘a’, 6 MapReduce程序处理流程 MapReduce程序框架的架构 (主从架构) JobTracker 客户端 TaskTracker TaskTracker TaskTracker map Reduce map Reduce map Reduce TCP/IP TCP/IP TCP/IP Hadoop集群典型架构 NameNode JobTracker DataNode Secondary NameNode TaskTracker DataNode TaskTracker DataNode TaskTracker TCP/IP TCP/IP TCP/IP TCP/IP 小结 云计算是一种新的计算模式 云计算就是要通过网络将IT基础设施集中调动和管理,以向用户提供按需服务 Hadoop是搭建云计算环境的一种分布式框架 Hadoop包括HDFS和MapReduce两个主要组件,前者实现分布式存储,后者实现分布式计算 参考资料 《hadoop实战》 / /wiki/Hadoop 谢谢大家! 搜索引擎索引 Hadoop的应用: * * * 1.云计算提供了最可靠、最安全的数据存储中心,用户不用再担心数据丢失、病毒入侵等麻烦。 很多人觉得数据只有保存在自己看得见、摸得着的电脑里才最安全,其实不然。你的电脑可能会因为自己不小心而被损坏,或者被病毒攻击,导致硬盘上的数据无法恢复,而有机会接触你的电脑的不法之徒则可能利用各种机会窃取你的数据。 反之,当你的文档保存在类似 Google Docs 的网络服务上,当你把自己的照片上传到类似 Google Picasa Web 的网络相册里,你就再也不用担心数据的丢失或损坏。因为在“云”的另一端,有全世界最专业的团队来帮你管理信息,有全世界最先进的数据中心来帮你保
您可能关注的文档
最近下载
- 仓储场地出租合同范本.docx VIP
- DL_T 596-2021 电力设备预防性试验规程.docx VIP
- 湖北农商行面试题目及答案.doc VIP
- 护理质量持续改进与患者身份识别.pptx
- (正式版)D-L∕T 849.6-2016 电力设备专用测试仪器通用技术条件 第6部分:高压谐振试验装置.docx VIP
- 族谱资料欢迎传阅妥善保管以存后世-陆氏家园.docx VIP
- 楼层别效用比与地价分配率.PDF VIP
- 毕业设计(论文)-基于PLC的自动上料系统设计.docx VIP
- 新课标下初中历史教学中学生历史素养的培养研究.pptx VIP
- 基于web体育馆场地预约系统的设计与实现毕业论文.docx
原创力文档


文档评论(0)