- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HBase_简介_(来自京东)很不
物理存储 * 5 、HRegion虽然是分布式存储的最小单元,但并不是存储的最小单元。 事实上,HRegion由一个或者多个Store组成,每个store保存一个columns family。 每个Strore又由一个memStore和0至多个StoreFile组成。如图: StoreFile以HFile格式保存在HDFS上。 物理存储 * HFile的格式为: 物理存储 HFile分为六个部分: Data Block 段:保存表中的数据,这部分可以被压缩 Meta Block段 (可选的):保存用户自定义的kv对,可以被压缩。 File Info 段:HFile的元信息,不被压缩,用户也可以在这一部分添加自己的元信息。 Data Block Index 段:Data Block的索引。每条索引的key是被索引的 block的第一条记录的key。 Meta Block Index段 (可选的):Meta Block的索引。 Trailer段:这一段是定长的。保存了每一段的偏移量,读取一个HFile时,会 首先读取Trailer,Trailer保存了每个段的起始位置(段的Magic Number用来 做安全check),然后,DataBlock Index会被读取到内存中,这样,当检索 某个key时,不需要扫描整个HFile,而只需从内存中找到key所在的block,通过一次磁盘io将整个 block读取到内存中,再找到需要的key Data Block Index采用LRU机制淘汰。 HFile的Data Block,Meta Block通常采用压缩方式存储,压缩之后可以大大减少网络IO和磁盘IO,随之而来的开销当然是需要花费cpu进行压缩和解压缩。 目标Hfile的压缩支持两种方式:Gzip,Lzo。 物理存储 * HLog(WAL log) HLog文件就是一个普通的Hadoop Sequence File,Sequence File 的Key是HLogKey对象,HLogKey中记录了写入数据的归属信息,除了table和region名字外,同时还包括 sequence number和timestamp,timestamp是”写入时间”,sequence number的起始值为0,或者是最近一次存入文件系统中sequence number。HLog Sequece File的Value是HBase的KeyValue对象,即对应HFile中的KeyValue,可参见上文描述。 目录 HBase 简介 HBase 体系结构 HBase 数据模型 HBase 提供的接口 HBase 优化 HBase 用途 HBase 交互接口 Native Java API,最常规和高效的访问方式,适合Hadoop MapReduce Job并行批处理HBase表数据 HBase Shell,HBase的命令行工具,最简单的接口,适合HBase管理使用 Thrift Gateway,利用Thrift序列化技术,支持C++,PHP,Python等多种语言,适合其他异构系统在线访问HBase表数据 REST Gateway,支持REST 风格的Http API访问HBase, 解除了语言限制 Hive,使用类似SQL语言来访问HBase Pig,可以使用Pig Latin流式编程语言来操作HBase中的数据,和Hive类似,本质最终也是编译成MapReduce Job来处理HBase表数据,适合做数据统计 目录 HBase 简介 HBase 体系结构 HBase 数据模型 HBase 提供的接口 HBase 优化 HBase 用途 HBase 优化——配置优化1 zookeeper.session.timeout(df:180000ms) hbase.regionserver.handler.count(df:10) hbase.hregion.max.filesize(df:256M) hbase.regionserver.global.memstore.upperLimit/lowerLimit(0.4/0.35) hfile.block.cache.size(df:0.2) hbase.hstore.blockingStoreFiles(df:7) hbase.hregion.memstore.block.multiplier(df:2) 。。。 HBase 优化——配置优化2 写速度关键因素 Table region分布均衡; 单台region server的region数; hbase.regionserver.handler.count hbase.regionser
您可能关注的文档
- 鲍集中心小学教职工岗位聘任方案.doc
- 鲁班奖、国家优质工程情况介绍及要求.doc
- 高阻燃抗熔EPS保温板——热固性材料.ppt
- 麦克斯韦等面积法则在范氏气体中的应用.doc
- 麦尔课件:《拟行路难(其四)》鲍照.ppt
- 麦德龙配送.doc
- 麦当劳的质量管理.doc
- 麻醉科住院医师规范化培训考核试卷B卷(附答案)doc.doc
- 麦斯威尔咖啡ppt.ppt
- 黄金海岸精装修及公共部位精装修工程施工组织设计.doc
- hdpe双壁波纹管施工方案_secret.doc
- How to use Noun Clauses in the writing如何在写作中使用名词性从句.doc
- HSE法律法规和其他要求符合性管理程序.doc
- HSE检查与监督管理程序.doc
- Hyatt Regency Hotel Walkway Collapse Engineering Failure凯悦摄政酒店人行道坍塌的工程失败.ppt
- H股回归A股 两类模式四种方案各显其能.doc
- ICU专业护士核心能力训练手册(N1级第一阶段).doc
- Income Taxes IAS 12 - Wiley Home所得税的国际会计准则12号-威利家.ppt
- Indesign CS5 GREP正则.doc
- HP筛查及预.ppt
最近下载
- (2024秋新版)人教版七年级数学上册全册PPT课件.pptx
- dixell帝思 xc15cx-xc35cx 调试维修参数设置资料.pdf
- transcad交通需求模型手册_chapter12公交分配.pdf VIP
- 高校后勤餐饮经营发展探究——以浙江树人大学为例.pdf VIP
- 幼儿园教室环创培训.pptx VIP
- 2023辽宁沈阳市铁西区面向全区招聘社区残疾人工作专职干事8人考试备考题库及答案解析.docx VIP
- 2025年安徽省池州市辅警协警笔试笔试预测试题(附答案).docx VIP
- 《追求理解的教学设计》读书心得.docx VIP
- 糖皮质激素诱导骨质疏松诊治专家共识.pptx VIP
- 2025内蒙古巴彦淖尔市能源(集团)有限公司第二批招聘55人笔试模拟试题及答案解析.docx VIP
文档评论(0)