- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Cassandra实时统计分享
zhaowei@
LAMP人 主题分享交流会
www.LAMPER.cn
QQ群:3330312
/lampercn
Outline
• 使用场景
• Cassandra简介
• 性能测试
• 实际应用
古希腊神话的杯具预言家
• Digg 的Cassandra杯具
– 工程副总裁John Quinn在Digg V4中使用Cassandra取代Mysql ,
导致上线后网站经常宕机。
– Quinn遭遇重大反对,至少遭遇了严重的短期问题,他也因此丢
掉了在Digg的工作。
– “Cassandra数据库速度更快,但或许它仌然处于实验期,也或
者是Digg正在对Cassandra数据库进行测试,总之Cassandra的
运行状况幵不能令用户满意。” CEO Kevin Rose
Best used
• Write more than you read (logging)
• One natural niche is real time data analysis
Twitter
摘自:
/kevinweil/rainbird -
realtime-analytics-at-twitter-strata-2011
Outline
• 使用场景
• Cassandra简介
• 性能测试
• 实际应用
简介
分布式无中心
弹性可扩展
高可用与容错
可调节的一致性
面向行
高性能
CAP
• CAP
– Consistency
– Availbility
– Partition Tolerance
CAP理论指出,同时只能具有这三个特性中的两个。
AP :Cassandra、CouchDB
数据模型
Cluster
Keyspace :数据的最外层容器,类似关系型数据库
Column family :容纳一组有序行的容器,每行包含一组有序列
Column :最基本数据结构单元,名称、值、时钟构成的三元组
Super column :value是一个子列的映射(一起查询的内容放一起)
五维哈希:
[Keyspace][Column family][Key][Super column][Column]
架构设计
P2P :对等结构,可用性和可扩展性
Gossip :流言协议用于故障检测(增量),故障节点计入列表
Anti-entropy :逆熵,副本同步机制,邻居交换Merkle树比对
Memtable、SSTable、Commit log :数据写入Commit log则讣
为写成功, Commit log可用于数据修复。
Hinted handoff :提示移交,提升弱一致性级别的写性能(ANY )
Bloom filter :判断元素是否存在于集合的超快速、不确定的判断
算法,可看做查询的缓存,假阳性结果
Tombstone :删除标记,合幵SSTable时清理
为什么写快
写优化是Cassandra的设计决策。
Memtable和Commit log的存在,写一个值不需要仸何的读或者定
位操作,所有的写都是以追加方式顺序写入的。
Outline
• 使用场景
• Cassandra
• 性能测试
• 实际应用
测试环境
• 硬件
– 4 node
• 软件
– Cassandra v1.0.0 ,Thrift API
• 数据
– Num of key space = 1, num of column family = 1,
replication factor = 2
– Random Partition方式600M x 1KB记录
– Byte Ordered
您可能关注的文档
最近下载
- 【中考真题】2025年上海英语试卷(含听力mp3).docx VIP
- (高清版)B-T 3836.2-2021 爆炸性环境 第2部分:由隔爆外壳“d”保护的设备.pdf VIP
- 课件录播专业教室建设方案.docx VIP
- 2025年贵州省辅警考试真题及答案.docx VIP
- 工作交接清单——标准模板交接单表格正式版.doc VIP
- GB_T 24021-2024 环境管理 环境标志和声明 自我环境声明 (II型环境标志).pdf VIP
- 渔政执法课件.pptx VIP
- 基于MQTT的远程数据采集与实时控制系统设计和应用.docx VIP
- 2025青岛版小学科学三年级上册1-5《制作动物分类图册》(教学课件)(新教材).pptx
- (高清版)-B-T 30146-2023 安全与韧性 业务连续性管理体系 要求.pdf VIP
文档评论(0)