Cassandra 数据库系统简单介绍.docVIP

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Cassandra 数据库系统简单介绍

[NOSQL] Cassandra 数据库系统简单介绍介绍: Apache Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开 发,用于储存收件箱等简单格式数据,集Google BigTable的数据模型与Amazon Dynamo的完全分布式的架构于一身。Facebook于 2008将 Cassandra 开源,此后,由于Cassandra良好的可扩放性,被Digg、Twitter等知名Web_2.0网 站所采纳,成为了一种流行的分布式结构化数据存储方案。? ?? ???Cassandra是一套高度可扩展、最终一致、分布式的结构化键值存储系统。Cassandra结合了Dynamo的分布技术和GOOGLE的BigTable数据模型。 Cassandra具有Dynamo的最 终一致性; 同时Cassandra相比典型的键/值数据存储数据模型更为丰富,它提供与Google的Bigtable相似的、基于ColumnFamily的 数据模型。 ? ?? ??? 架构: Cassandra使用了Google BigTable的数据模型,与面向行的传统的关系型数据库不同,这是一种面向列的数据库,列被组织成为列族 (Column Family),在数据库中增加一列非常方便。对于搜索和一般的结构化数据存储,这个结构足够丰富和有效。 Cassandra的系统架构与Dynamo一脉相承,是基于O(1)DHT(分布式哈希表)的完全P2P架构,与传统的基于 Sharding的数据库集群相比,Cassandra可以几乎无缝地加入或删除节点,非常适于对于节点规模变化比较快的应用场景。 Cassandra的数据会写入多个节点,来保证数据的可靠性,在一致性、可用性和网络分区耐受能力(CAP)的折衷问题上,Cassandra比较灵活,用户在读取时可以指定要求所有副本一致 (高一致性)、读到一个副本即可(高可用性)或是通过选举来确认多数副本一致即可(折衷)。这样,Cassandra可以适用于有节点、网络失效,以及多 数据中心的场景。 特性: 和其他数据库比较,Cassandra有三个突出特点: 模式灵活 :使用Cassandra,像文档存储,你不必提前解决记录中的字段。你可以在系统运行时随意的添加或移除字段。这是一个惊人的效率提升,特别是在大型部 署上。 真正的可扩展性 :Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量,可以指向另一台电脑。你不必重启任何进程,改变应用查询,或手动迁移任何数据。 多数据中心识别 :你可以调整你的节点布局来避免某一个数据中心起火,一个备用的数据中心将至少有每条记录的完全复制。 一些使Cassandra提高竞争力的其他功能: 范围查询 :如果你不喜欢全部的键值查询,则可以设置键的范围来查询。 列表数据结构 :在混合模式可以将超级列添加到5维。对于每个用户的索引,这是非常方便的。 分布式写操作 :有可以在任何地方任何时间集中读或写任何数据。并且不会有任何单点失败。 数据模型:(此解释来源于:/?p=17) Cassandra包括Keyspace、ColumnFamilies、Row、Column、SuperColumn等5个 化繁为简 如果我们不关心具体的实现,只关注数据模型,我们可以先将Cassandra视为一个key/value系统,系统根据key决定数据分布在哪些节 点上。其他的结构都是在value上做文章。 当把Cassandra简化回key/value系统后,我们就可以针对key和value分别分析了。 key级别的模型 在实际应用中,通常一个集群会存储很多个不同应用的数据,Cassandra也考虑到了这一点,所以Cassandra有一个keyspace的概 念。 一个集群可以配置多个keyspace,如果我们拿传统的RDBM来对比的话,可以将一个集群看成是数据库,将keyspace看成是一个 scheme。通常一个keyspace存储一个应用的数据。 value级别的模型 Cassandra类似bigtable的ColumnFamily数据模型,都是通过在value上做文章得以实现的。在展开具体的value分 析前,再罗嗦一遍,数据的分布是根据key决定的,和value没有关系。 value中包含3个概念: ColumnFamily SuperColumn Column 我们自底往上介绍,从最基本的单位??Column讲起。 Column Column是最基本的存储单位,它是一个三元组,由{name, value, timestamp}组成。比如下面是使用json格式表示的一个column: { ? ???name: nick, ? ???value: ruohai, ?

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档