阿里hbase业务设计实践.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
阿里HBase业务设计实践 穆公(朱金清 suinking@) 微博:淘穆公 2013.4.21 大纲 简介 数据模型 业务设计 产品线使用建议 监控 总结 简介 Nosql: column-based storage system Large volume of data High write (esp. random ) through-put / Good ramdon read performance Range query Row-base transaction Auto-sharding Compare to Bigtable Hbase Based on Hadoop HDFS or other HDFS Bigtable based on GFS Large volume 三层索引结构 Region的大小默认最大是256M 按照平均128M算; 假设:一个rowkey 1KB Root table: 128M=128*1024KB 即2^7 * 2^10 = 2^17 bucket Meta table: (2^17)^2 = 2 ^34 bucket 记录数:2^51 条记录 其它特征 三层B+树的扩展LSMTree[1] 适合于范围查询 Rowkey的字母顺序来排序(byte数组存储) Row-base 事务级别仅限于rowkey级别 Auto-sharding Region的自动split/move 问题:牺牲了CAP中的? [1] Jim Gray and Franco Putzolu, The Five Minute Rule for Trading Memory for Disk Accesses and The 10 Byte Rule for Trading Memory for CPU Time, Proceedings of the 1987 ACM SIGMOD Conference, pp 395-398. 已有适合的使用场景 海量数据写入 历史数据 批量写入 消息类(类似Facebook的message) 消息类 Schema-free 业务监控 LOG-Append类的业务 全网HSF日志 全网每天上百亿 大表的复杂/多维度索引 检索索引,主数据在mysql 分析类 大批量读取 HBase+缓存TAIR 现有集群状况 集群名称 TPS(avg) 11.11最高 QPS(avg) 11.11最高 版本 业务 7k 1.8w 1.6w 3.4w 0.90.2 业务 1.8w 2w 1.2w 1.4w 业务 7k 3w 2w 5w 业务 1k 2k 2k 6k 业务 2.5w 5w 2w 6w 业务 10w 25w(最高50w) 1w 2w 0.94 业务 4w 20w (压测) 2k 3w(压测) 0.94 业务 每天2-3kw - RT在ms级别 - 0.90.2-定制版 业务 10w 25w 15w 100w 0.94 业务 3k 1.4w 3k 6k 0.94 业务 1.5w 2w 6k 8k 0.94 与MYSQL的对比 场景 HBase优点 HBase缺点 MySQL优点 MySQL缺点 业务表使用 使用简单,一张表即可 不过没有SQL 有SQL;分库分表,灵活 分库后 更新模式 插入多的适合 RKupdate差 DML 二级索引策略 需借助索引表 强 DDL问题 客户端接口 灵活自己掌握 无标准SQL SQL 写性能 非常强 顺序写入时瓶颈在一台rs 较强 几千tps/单套库 读性能 较强;支持scan 依赖内存 很强;支持scan 依赖索引 可扩展性 强 借助愚公/datax工具可动态扩展 弱 运维方便 自己定制 不够成熟 成熟 DDL 时间短;92版本可以在线 若有索引表,需要自己填充 Create index即可 时间长;block 读写 稳定性CAP CP A AP C NoSQL使用情况 TAOBAO OTS/HBase BAIDU BAILING/ARMOR/HYPERTABLE(HCE) TENCENT TDB/TSSD FACEBOOK HBASE 大纲 简介 数据模型 业务设计 产品线使用建议 监控 总结 Region Server Region Store … Region … HDFS Zookeeper cluster Master Region Server … Back up Master Back up Master … Hbase Client Hbase Client … NameNode DataNode DataNode … HDFS client 架构图 客户端 LSM C0树 同一机器,目的?

文档评论(0)

kelly + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档