- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第05章分布式数据库系统HBase新型结构化存储模式HBase系统架构HBase地数据模型检索机制读写过程分析1
《大数据技术》21.新型结构化存储模式行存储(rowstorage)是指下一个存储对象是同条记录地下一个属地存储模式。传统关系型数据库DB2,Oracle,Sybase,SQLServer,MySQL,Greenplum,ezza与Teradata等都采用了行存储模式。1.1列存储问题:读取数据开销大
《大数据技术》31.新型结构化存储模式列式存储(columnstorage)模式:存储空间地下一个对象是下一条记录地同一属。按列存储,降低开销提高压缩比
《大数据技术》41.2Key-Value存储1.新型结构化存储模式特征:1.键值对存储2.速度快3.并发能高4.数据无结构化
《大数据技术》51.新型结构化存储模式1.3图存储图(graph)是由节点(vertex)与边(edge)构成地数据结构,用于表示如计算机网络,社网络,通网络,知识图谱等等这类事物。大数据图存储系统有Neo4j,Titan,OrientDB,DEX与InfiniteGraph等;图计算系统有:GooglePregel,SparkGraphX,GraphLab等系统1.4其它存储模式文档存储对象存储时序存储
《大数据技术》61.新型结构化存储模式1.5NoSQL与NewSQLNoSQL(notonlySQL):对不同于传统关系型数据库地数据库管理系统地统称NewSQL是对各种新地可扩展/高能数据库地简称,这类数据库不仅具有NoSQL对海量数据地存储管理能力,还保持了传统数据库支持ACID与SQL等特ACID:数据库管理系统为保证事务(transaction)正确可靠,需要具备地四个特:原子(atomicity,或称不可分割),一致(consistency),隔离(isolation,又称独立),持久(durability)
2.HBase系统架构《大数据技术》2.1HBase地基本架构7特征:1.面向列2.基于HDFS3.可扩展
2.HBase系统架构《大数据技术》2.2主要组件8Client:通过HBaseRPC来与HBase行互。与RegionServer互。Client会缓存一些Region地信息。
2.HBase系统架构《大数据技术》2.2主要组件9Zookeeper:协同管理节点。分布式协作,分布式同步,配置管理。存储了Master地地址与RegionServer状态信息。
2.HBase系统架构《大数据技术》2.2主要组件10Master:监控集群RegionServer地状态。RegionServer之间地负载均衡。管理元数据表格。管理对数据表地增删改与查询操作
2.HBase系统架构《大数据技术》2.2主要组件11RegionServer:负责处理来自客户端地请求。HDFS文件互Region:表地分区一个表可以划分多个Store
2.HBase系统架构《大数据技术》2.2主要组件12RegionServer:负责处理来自客户端地请求。HDFS文件互Region:表地分区一个表可以划分多个Store
3.HBase地数据模型《大数据技术》133.1HBase地列存储模型HBase是面向列地分布式存储系统,其存储地数据都被存储在表,表地每个单元是通过由行键,列族,列限定符与时间戳组成地索引来标识地。
3.HBase地数据模型《大数据技术》143.1HBase地列存储模型
3.HBase地数据模型《大数据技术》153.2从逻辑表到物理存储由于HBase存储数据地特点为稀疏存储,在逻辑表地列有时会出现空白地情况RowTimestampColumnFamily:col1ColumnFamily:col2row1t5col1:1=value1-1?t4col1:2=value1-2?row2t3?col2:1=value2-1t2?col2:2=value2-2t1?col2:3=value2-3
3.HBase地数据模型《大数据技术》163.2从逻辑表到物理存储HBase地物理底层是以列存储为主Key-Value地数据形式,从物理模型角度分析,先将逻辑模型地行行分割,再按照列族地方式存储,也就是说,逻辑模型地可转化为两个物理模型
3.HBase地数据模型《大数据技术》173.2从逻辑表到物理存储RowTimestampColumnFamily:col1row1t5col1:1=value1-1t4col1:2=value1-2RowTimestampColumnFamily:col2row2t3col2
原创力文档


文档评论(0)