Cassandra 数据库系统简单介绍.docVIP

下载本文档

7
0
约2.32万字
约 16页
2018-02-28 发布于江西
举报
版权申诉

Cassandra 数据库系统简单介绍.doc

1、本文档共16页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Cassandra 数据库系统简单介绍

[NOSQL] Cassandra 数据库系统简单介绍介绍： Apache Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发，用于储存收件箱等简单格式数据，集Google BigTable的数据模型与Amazon Dynamo的完全分布式的架构于一身。Facebook于 2008将 Cassandra 开源，此后，由于Cassandra良好的可扩放性，被Digg、Twitter等知名Web_2.0网站所采纳，成为了一种流行的分布式结构化数据存储方案。? ?? ???Cassandra是一套高度可扩展、最终一致、分布式的结构化键值存储系统。Cassandra结合了Dynamo的分布技术和GOOGLE的BigTable数据模型。 Cassandra具有Dynamo的最终一致性；同时Cassandra相比典型的键/值数据存储数据模型更为丰富，它提供与Google的Bigtable相似的、基于ColumnFamily的数据模型。? ?? ???架构：Cassandra使用了Google BigTable的数据模型，与面向行的传统的关系型数据库不同，这是一种面向列的数据库，列被组织成为列族（Column Family），在数据库中增加一列非常方便。对于搜索和一般的结构化数据存储，这个结构足够丰富和有效。Cassandra的系统架构与Dynamo一脉相承，是基于O(1)DHT（分布式哈希表）的完全P2P架构，与传统的基于 Sharding的数据库集群相比，Cassandra可以几乎无缝地加入或删除节点，非常适于对于节点规模变化比较快的应用场景。Cassandra的数据会写入多个节点，来保证数据的可靠性，在一致性、可用性和网络分区耐受能力（CAP）的折衷问题上，Cassandra比较灵活，用户在读取时可以指定要求所有副本一致（高一致性）、读到一个副本即可（高可用性）或是通过选举来确认多数副本一致即可（折衷）。这样，Cassandra可以适用于有节点、网络失效，以及多数据中心的场景。特性：和其他数据库比较，Cassandra有三个突出特点：模式灵活：使用Cassandra，像文档存储，你不必提前解决记录中的字段。你可以在系统运行时随意的添加或移除字段。这是一个惊人的效率提升，特别是在大型部署上。真正的可扩展性：Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量，可以指向另一台电脑。你不必重启任何进程，改变应用查询，或手动迁移任何数据。多数据中心识别：你可以调整你的节点布局来避免某一个数据中心起火，一个备用的数据中心将至少有每条记录的完全复制。一些使Cassandra提高竞争力的其他功能：范围查询：如果你不喜欢全部的键值查询，则可以设置键的范围来查询。列表数据结构：在混合模式可以将超级列添加到5维。对于每个用户的索引，这是非常方便的。分布式写操作：有可以在任何地方任何时间集中读或写任何数据。并且不会有任何单点失败。数据模型：（此解释来源于：/?p=17）Cassandra包括Keyspace、ColumnFamilies、Row、Column、SuperColumn等5个化繁为简如果我们不关心具体的实现，只关注数据模型，我们可以先将Cassandra视为一个key/value系统，系统根据key决定数据分布在哪些节点上。其他的结构都是在value上做文章。当把Cassandra简化回key/value系统后，我们就可以针对key和value分别分析了。key级别的模型在实际应用中，通常一个集群会存储很多个不同应用的数据，Cassandra也考虑到了这一点，所以Cassandra有一个keyspace的概念。一个集群可以配置多个keyspace，如果我们拿传统的RDBM来对比的话，可以将一个集群看成是数据库，将keyspace看成是一个 scheme。通常一个keyspace存储一个应用的数据。value级别的模型Cassandra类似bigtable的ColumnFamily数据模型，都是通过在value上做文章得以实现的。在展开具体的value分析前，再罗嗦一遍，数据的分布是根据key决定的，和value没有关系。value中包含3个概念：ColumnFamilySuperColumnColumn我们自底往上介绍，从最基本的单位??Column讲起。ColumnColumn是最基本的存储单位，它是一个三元组，由{name, value, timestamp}组成。比如下面是使用json格式表示的一个column： {? ???name: nick,? ???value: ruohai,?