介绍移动云计算服务端技术.pptxVIP

下载本文档

2
0
约3.62千字
约 23页
2017-09-07 发布于上海
举报
版权申诉

介绍移动云计算服务端技术.pptx

1、本文档共23页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

介绍移动云计算服务端技术

HADOOP介绍 2011年5月15 What is Hadoop Apache Hadoop 是一个用java语言实现的软件框架，在由大量计算机组成的集群中运行海量数据的分布式计算，它可以让应用程序支持上千个节点和PB级别的数据。 Hadoop 组成 Hadoop 组成 Hadoop core Hadoop的核心子项目，提供了一个分布式文件系统(HDFS)和支持MapReduce的分布式计算。 HBase 建立在Hadoop内核之上，提供可靠的，可扩展的分布式数据库。 ZooKeeper 一个高效的，可扩展的协调系统。分布式应用可以使用ZooKeeper来存储和协调关键共享状态。 PIG 建立于Hadoop内核之上，是一种支持并行计算运行框架的高级数据流语言。 Hadoop core MapReduce Map：任务的分解 Reduce：结果的汇总两大核心设计 HDFS NameNode DataNode Client MapReduce HDFS HDFS NameNode 可以看作是分布式文件系统中的管理者，存储文件系统的meta-data，主要负责管理文件系统的命名空间，集群配置信息，存储块的复制。 DataNode 是文件存储的基本单元。它存储文件块在本地文件系统中，保存了文件块的meta-data，同时周期性的发送所有存在的文件块的报告给NameNode。 Client 就是需要获取分布式文件系统文件的应用程序。 HDFS操作举例文件写入： 1. Client向NameNode发起文件写入的请求。 2. NameNode根据文件大小和文件块配置情况，返回给Client它所管理部分DataNode的信息。 3. Client将文件划分为多个文件块，根据DataNode的地址信息，按顺序写入到每一个DataNode块中。文件读取： 1. Client向NameNode发起文件读取的请求。 2. NameNode返回文件存储的DataNode的信息。 3. Client读取文件信息。文件块复制： 1. NameNode发现部分文件的文件块不符合最小复制数或者部分DataNode失效。 2. 通知DataNode相互复制文件块。 3. DataNode开始直接相互复制。 HBase-数据模型每个数据行都包括一个可排序的关键字，和任意数目的列 HBase利用的是column-oriented列导向存储机制，不同于传统的row-oriented行导向存储机制对于Null值的存储是不占用任何空间的最适合使用HBase存储的数据是非常稀疏的数据所有数据库更新操作都有时间戳。HBase对每个数据单元，只存储指定个数的最新版本。 HBase-概念模型一个表格是一些行的集合，每行包含一个行关键字（和一个可选的时间戳），和一些可能有数据的列（稀疏），如下图： HBase-物理模型在概念上表格是一个稀疏的行/列矩阵，但是在物理上，它们按照列存储，上面“概念模型”中的表格在物理上的存储方式如下所示： ZooKeeper What is ZooKeeper? 一个高效的，可扩展的协调系统 Why is ZooKeeper? 保证用户读取的数据是最新的当用户正在查看的数据被修改时，保证用户会被及时告知保证来至一个用户的所有请求会被按顺序处理保证所有用户得到的数据是一致的 ZooKeeper-Data Model ZooKeeper提供的命名空间和一般的文件系统是极为相似的，除了ZooKeeper的文件系统的每个节点（node）既可以包含数据又可以包含子节点 ZooKeeper提供暂时节点的概念，这些节点随着创建他们的会话的结束而结束。 ZooKeeper允许用户在节点上设置“监视”机制，当节点的内容被改变时，“监视”机制会告知用户 PIG Pig是SQL-like语言,是在MapReduce上构建的一种高级查询语言,把一些运算编译进MapReduce模型的Map和Reduce中,并且用户可以定义自己的功能支持的运算算数符号：+,-,*,/多种数据类型：string,int,float,long等比较运算:==, !=, , =, , =,eq, neq, gt, gte, lt,lte,matches复杂的数据类型:bag,tuple,map相关运算:FILTER，GROUP BY，ORDER，DISTINCT，UNION，JOIN，FOREACH ... GENERATE数据统计:COUNT，SUM，AVG，MIN，MAX等。 PIG（Cont.） pig支持的原始类型数据: int,long,float,double,char数组,byte数组 pig

您可能关注的文档

文档评论（0）

118zhuanqian + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

介绍移动云计算服务端技术.pptxVIP