- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Cassandra关键技术详解
Cassandra 关键技术详解
1. NoSQL 运动与Cassandra 系统
所谓键值存储就是用一个键来表达事物的属性,而用一个值来表达这个特征
(属性)的取值。键值数据广泛存在于社交网络、工业大数据等应用当中。键值
存储的代表是Facebook 基于谷歌和亚马逊技术开发的Cassandra 系统。
键值存储是一类非常重要的大数据存储系统,主要管理模式动态变化的、弱
结构化数据键值存储系统,起源于2010 年前后的NoSQL 运动。
1.1 NoSQL 运动
NoSQL 一词最早出现于1998 年是意大利学者Carlo Strozzi 开发的一个轻量
开源,但不支持SQL 语言的关系数据库。
2009 年 6 月,在哥伦比亚广播集团旗下的互动媒体公司世界上最大的社会
音乐平台Lastfm 的技术总监Jon Oskarsson 组织了首次NoSQL 的研讨会,这次
会议上Rackspace 的Eric Evans 再次提出了NoSQL 的概念,这次只有一天时间
的技术分享会成为引爆NoSQL 运动的标志性事件。
如果说 1998 年的NoSQL 项目仅仅是否定了 SQL 语言,而本次NoSQL 运
动的发展则围绕着三个否定,即否定关系模型、否定ACID 事务、否定SQL 语
言,其核心是否定关系模型。因此,对NoSQL 最普遍的解释是非关系型的,
强调Key-Value 存储和文档数据库的优点,而不是单纯的反对RDBMS 。
大数据促进了NoSQL 的迅速繁荣,出现了大量的技术多样的NoSQL 系统,
这些 NoSQL 系统主要可以分为三大类:即文档系统 (MongoDB )、键值系统
(Cassandra、Hbase )和图系统 (Neo4J )。
1.2 Cassandra NoSQL 数据库简介
本文主要介绍键值存储的代表Cassandra 系统,Apache Cassandra 是一套2008
年开源的分布式NoSQL 数据库系统,由就职于脸谱公司的两位工程师开发。
Cassandra 的技术主要来源于两个方法,一个是谷歌的Bigtable ,也就是我们
常说的大表,作为Cassandra 的数据模型;另一个是Amazon 中的DynamoDB ,
主要借鉴了它的P2P 架构。
Cassandra 开源后围绕这个系统的推广服务与增值开发。2010 年 Jonathan
Ellis 和Matt Pfeil ,创立了DATASTAX 公司,根据Cassandra2015 年7 月的官方
数据,目前Cassandra 拥有包括苹果、ebay、 Hulu 在内的 1500 家企业用户。它
最大的应用在苹果公司,管理了75000 个节点,规模为 10 个TB,Cassandra 的
技术来源决定了它所拥有的技术特点:即无单点故障、高可用和可配置的灵活的
一致性,它适合的应用场合包括时间序列数据 物联网数据、社交媒体数据等等。
2. Cassandra 数据模型、接口和访问语言
2.1 Cassandra 数据模型 (逻辑模型)
Cassandra 的数据模型借鉴了谷歌Bigtable 的设计,包括四个概念:
(1)键空间即KeySpace 相当于关系数据模型当中的数据库,是最上层的命
名空间;
(2 )列族ColumnFamily,相当于关系数据库中的表,但它比表更稀疏;
(3)行Row 表示一个数据对象,存在于ColumnFamily 当中;
(4 )列Column 相当于属性,是存储的基本单元
Cassandra 的主要概念之间的包含关系如图所示,其中:
(1)KeySpace 中的settings,主要设置副本数量Hash 策略等;
(2 )ColumnFamily 中的settings 主要设置key 缓存、读修复的概率、列的排序
方式等属性;
(3 )Column 是 Cassandra 存储的基本单元,它是一个三元组(name,
value,timestamp) 。一般情况下它不支持基于列值的查询。而在 1.1 版以后,
Cassandra 对它的Column 扩展了一个新的属性即TTL (存活时间)。
Cassandra 中的行由很多列组成
您可能关注的文档
最近下载
- 肯尼亚建筑市场行业报告.pptx
- 浙江杭州余杭交通集团有限公司招聘笔试题库2023.pdf VIP
- 人工胆囊、人工胆囊设备和人工胆囊在胆囊手术中的应用.pdf VIP
- 重力与弹力高一上学期物理人教版2019必修第一册+.pptx VIP
- 胃癌的诊治现状与进展.pptx VIP
- 数控压装压力机 第2部分:技术条件.docx VIP
- 【课件】匀变速直线运动速度与时间的关系+课件-高一上学期物理人教版(2019)必修第一册.pptx VIP
- XX医院职能部门监管手术、麻醉授权管理督导、检查、总结、反馈及持续改进记录表.pdf VIP
- 电力调度数据网络接入技术规范及网络拓扑图.doc VIP
- ZZGA高频开关整流器使用说明书.doc
文档评论(0)