- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
浙江经贸职业技术学院
《大数据基础》.移动商务营销课程群
3.1.1分布式存储概述
1
集中式存储和分布式存储
集中式存储就是指由一台或多台主计算机组成中心节点,数据集中存储于这个中心节点中,并且整个系统的所有业务单元都集中部署在这个中心节点上,系统所有的功能均由其集中处理。
集中式存储系统最大的特点就是部署结构简单,由于集中式系统往往基于底层性能卓越的大型主机,因此无需考虑如何对服务进行多个节点的部署,也就不用考虑多个节点之间的分布式协作问题。
3.1.1分布式存储概述
1
集中式存储和分布式存储
分布式存储,是相对于集中式存储来说的,是将数据分散存储在多台独立的网络服务器上,这些服务器在空间部署上可以随意分布,可能被放在不同的机柜上,也可能在不同的机房中,甚至分布在不同的城市。
分布式存储系统采用可扩展的系统结构,满足了大数据应用存储的需要,能够利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
3.1.1分布式存储概述
2
分布式存储系统的特性
3.1.1分布式存储概述
CAP理论
加州大学伯克利分校的计算机教授EricBrewer在2000年提出,其核心思想是任何基于网络的数据共享系统最多只能满足数据一致性(Consistency)、可用性(Availability)和分区容忍性(PartitionTolerance)三个特性中的两个。
3
分布式存储系统面临的挑战
3.1.1分布式存储概述
3
分布式存储系统面临的挑战
3.1.1分布式存储概述
分区容忍性
一个分布式系统里面,节点组成的网络本来应该是连通的。然而可能因为一些故障,使得有些节点之间不连通了,整个网络就分成了几块区域。数据就散布在了这些不连通的区域中。这就叫分区。
当你一个数据项只在一个节点中保存,那么分区出现后,和这个节点不连通的部分就访问不到这个数据了。这时分区就是无法容忍的。
提高分区容忍性的办法就是一个数据项复制到多个节点上,那么出现分区之后,这一数据项就可能分布到各个区里,容忍性就提高了。
3
分布式存储系统面临的挑战
3.1.1分布式存储概述
一致性和可用性的矛盾
由于当前的网络硬件肯定会出现延迟丢包等问题,所以分区容忍性是我们必须需要实现的。根据CAP理论,我们只能在一致性和可用性之间进行权衡。
总之,数据存在的节点越多,分区容忍性越高,这就要求复制更新的数据就越多,一致性就越难保证。为了保证一致性,每次写操作就都要等待全部节点写成功,更新所有节点数据所需要的时间就越长,可用性就会降低。
3
分布式存储系统面临的挑战
3.1.1分布式存储概述
4
分布式存储系统的分类
数据分类
由于分布式存储系统所面临的数据需求相对复杂,大致可以分为三类:
3.1.1分布式存储概述
4
分布式存储系统的分类
分布式存储按照处理不同类型的数据,大致可分为以下四类:
《大数据基础》
在线开放课程组
《大数据基础》.移动商务营销课程群
文档评论(0)