HBase分布式存储系统应用 习题答案(林徐 第二版) 水利.pdf

HBase分布式存储系统应用 习题答案(林徐 第二版) 水利.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
习题答案 第 1 章 HBASE 介绍 一、选择题 1.A 2 .B 3 .C 4 .C 二、简答题 1.答: 行式存储是指一行中的数据在存储介质中是连续存储的。 列式存储是指一列中的数据在存储介质中是连续存储的; (1)行数据库适用于读取出少行、多列的情况; 列数据库相反,适用于读取出少列、多行的情况。 (2 )列数据库可以节省空间,如果某一行的某一列没有数据,那么在列存储时,就可 以不存储该列的值。 2 .答: 使用HBase 作为数据存储,捕获来自于各种数据源的增量数据。比如目前流行的Kylin、 阿里内部的日志同步工具TT、图组件Titan、日志收集系统Flume 等。 3 .答: 优点: (1)高容错性。 (2 )适合大数据的处理。 (3 )流式文件写入。 (4 )可构建在廉价机器上。 缺陷: (1)不适合低延迟数据访问。 (2 )无法高效存储大量的小文件。 (3 )不支持多用户写入及任意修改文件。 第 2 章 HBase 模型和系统架构 一、选择题 1.A 2 .A 3 .A 4 .B 二、填空题 1.主从分布式 HDFS 2 .Row Key 2 HBase 分布式存储系统应用 (第二版) 3 .全表扫描 4 .三 5 .HRegion 三、简答题 1.答: 在表里面,每一行代表着一个数据对象,每一行都是以一个行键(Row Key )进行唯 一标识的。HBase 中的行里包含一个Key 和一个或者多个包含值的列。行键并没有什么特 定的数据类型,以二进制的字节来存储。Row Key 只能由一个字段组成而不能由多个字段 组合组成,HBase 对所有行按照Row Key 升序排序,在设计Row Key 时将经常一起读取的 行放到一起。 2 .答: 一个行键映射一个列族数组,列族数组中的每个列族又映射一个列标识数组,列标识 数组中的每一个列标识又映射到一个时间戳数组,里面是不同时间戳映射下不同版本的值, 但是默认取最近时间的值,所以可以看成是列标识和它所对应的值的映射。 3 .答: (1)容量巨大。 (2 )面向列。 (3 )稀疏性。 (4 )数据多版本。 (5 )可扩展性。 (6 )高可靠性。 (7 )高性能。 (8 )数据类型单一。 4 .答: HBase 同样是主从分布式架构,隶属于Hadoop 生态系统,由以下组件组成:Client、 ZooKeeper 、HMaster 、HRegionServer 和HRegion 。在底层,它将数据存储在HDFS 中,总 体结构如图所示。

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档