- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知识点复习
2019/04/29
第一章
1.1 云计算的定义
《信息周刊》(InformationWeek):云计算是一个环境,其中任何的IT资源都可以以服务的形式提供。
1.2 云计算的优势
总体来看,云计算至少有以下四个优势:
按需供应的无限计算资源;
无须事先花钱就能使用的IT架构;
基于短期的按需付费的资源使用;
单机难以提供的事务处理环境。
第一章
1.3 云计算的公共特征
云计算明显区别于传统的服务的特征,包括:弹性伸缩、快速部署、资源抽象、按用量收费、宽带访问
1.4 云计算的分类
根据云的部署模式和云的使用范围进行分类
(1)公共云
(2)私有云(或称专属云)
(3)社区云
(4)混合云
(5)行业云
(6)其他云类型 -消费云、企业云
第一章
1.5 针对云计算的服务层次和服务类型进行分类
(1)基础设施即服务(Infrastructure as a Service,IaaS)
(2)平台即服务(Platform as a Service,PaaS)
(3)软件即服务(Software as a Service,SaaS)
云计算的纵向云栈逻辑结构
第一章
1.6 云计算领域中使用的开源软件
主要以IaaS和PaaS两个层面为主
IaaS层面
OpenStack、CloudStack、oVirt、Zstack
PaaS层面
OpenShift、Rancher、CloudFoundry
调度平台Kubernetes、Mesos
第二章
1.7 ACID原则
ACID是数据库事务正常执行的四个原则,分别指原子性、一致性、独立性及持久性。
1.8 CAP理论
一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三项中的两项
第二章
1.9 BASE理论
BASE核心思想是即使无法做到强一致性(Strong Consistency,CAP的一致性就是强一致性),但应用可以采用适合的方式达到最终一致性(Eventual Consistency)。
BASE是指基本可用(Basically Available)、软状态(Soft State)、最终一致性(Eventual Consistency)。、
分布式存储中一般一份数据至少会有三个副本,允许不同节点间副本同步的延时就是软状态的体现。
第二章
2.0 一致性散列
节点宕机或者增加节点时,数据对象存储节点的选择(容错性、扩展性)
为了解决数据倾斜问题,一致性散列算法引入了虚拟节点机制,即对每一个服务节点计算多个散列,每个计算结果位置都放置一个此服务节点,称为虚拟节点。
节点宕机
增加节点
对象存放位置如何变化?
第二章
2.1 分布式系统
Google: GFS, MapReduce, Bigtable处理海量数据的分布式系统。
分布式系统的一个主要类别是分布式存储,而分布式存储与当今同样备受关注的云存储和大数据关系密切,分布式存储是基础,云存储和大数据是构建在分布式存储之上的应用。
Hadoop由两个重要模块组成。一个是Hadoop分布式文件系统(Hadoop Distributed File System),顾名思义,就是一个分布式的文件系统,可以将文件数据分布式地存储在集群中的不同节点上。另一个是MapReduce系统,是一个针对大量数据的分布式计算系统。
第二章
2.2 Hadoop实例
Hadoop分布式文件系统(HDFS)是一个主从式的分布式文件系统,是GFS的一种开源实现。
而HDFS集群由一个NameNode和多个DataNode组成,除此之外还有用于热备份的Secondary NameNode,防止集群出现单点故障。
同一份数据会以多份副本(默认3个副本)存储在不同的DataNode上,一旦某一个DataNode宕机,NameNode会立即采取手段来处理问题。
第二章
2.2 Hadoop实例
MapReduce工作机理
MapReduce既是Hadoop中的模块,也是一个计算模型。用户需要自己将算法划分成Map和Reduce两个阶段。首先将数据划分为小块的数据,将
原创力文档


文档评论(0)