- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[计算机]cassandra的初步使用及一些简单的操作
Apache Cassandra
Apache Cassandra是一套开源分布式数据库管理系统。它最初由Facebook开发,用于储存特别大的数据。
主要特性: ● 分布式
● 于column的结构化?
● 高伸展性 Cassandra是一个混合型的非关系的数据库,类似于Google的BigTable。Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对Cassandra 的一个写操作,会被复制到其它节点上去,对Cassandra的读操作,也会被路由到某个节点上面去读取。对于一个Cassandra群集来说,扩展性能是比较简单的事情,只管在群集里面添加节点就可以了。
Cassandra的主要功能比 Dynamo(分布式的Key-Value存 储系统)更丰富,但支持度却不如文档存储MongoDB(介于关系数据库和非关系数据库之间的开源产品,是非关系数据库当中功能最丰富,最像关系数据库的。支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型。)
Cassandra最初由Facebook开发,后转变成了开源项目。它是一个网络社交云计算方面理想的数据库。以Amazon专有的完全分布式的Dynamo为基础,结合了Google BigTable基于列族(Column Family)的数据模型。P2P去中心化的存储。很多方面都可以称之为Dynamo 2.0。 和其它数据库比较,Cassandra有三个突出特点:
■? 模式灵活 :使用Cassandra,像文档存储,你不必提前解决记录中的字段。你可以在系统运行时随意的添加或移除字段。这是一个惊人的效率提升,特别是在大型部署上。
■? 真正的可扩展性 :Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量,可以指向另一台计算机。你不必重启任何进程,改变应用查询,或手动迁移任何数据。
■? 多数据中心识别 :你可以调整你的节点布局来避免某一个数据中心起火,一个备用的数据中心将至少有每条记录的完全复制。
一些使Cassandra提高竞争力的其它功能:
■? 范围查询 :如果你不喜欢全部的键值查询,则可以设置键的范围来查询。
■? 列表数据结构 :在混合模式可以将超级列添加到5维。对于每个用户的索引,这是非常方便的。
■? 分布式写操作 :有可以在任何地方任何时间集中读或写任何数据。并且不会有任何单点失败。
Cassandra分布式节点服务器的简单部署
文章分类:数据库
Cassandra作为目前很热门的一个NOSQL型数据库,引起了很多的关注。对NOSQL感兴趣的我,也来作了一次简单的测试。 废话不多说,下面就来介绍下Cassandra多节点的部署。 部署要求: 1. JDK1.6 2. OS:linux,我在windows上实验过,不知道为啥一直没通(7000端口上只有windows的发包,双方不互相通信) 3. cassandra 0.6 OK,基本的东西都有了,进入到cassandra的目录,首先需要修改一些相关的文件路径: 1. perties???? 文件输出路径修改 2. storage-conf.xml??? CommitLogDirectory和DataFileDirectory路径修改 接着进行分布式节点的配置,还是修改torage-conf.xml : 1.? ClusterNameTest Cluster/ClusterName ????? 这个要求所有节点的名字都相同,如果不相同,则报类似 AName != BName 的错误 2. ColumnFamily Name=Standard1 CompareWith=BytesType/ ????? 配置ColumnFamily 的一些属性,其中name是所要使用的ColumnFamily 名称,可以多个,客户端做CRUD操作时需要指定。注意所有的节点配置都需要一样(我就曾因配置不一致出过ClassCastException的异常) 3. ReplicationFactor2/ReplicationFactor ????? 配置数据需要复制的数量,复制的策略分RackUnawareStrategy和RackAwareStrategy两种方式(策略没细看不再描述) 4.? Seeds ????? Seed20/Seed ? Seed81/Seed ? Seed32/Seed ??? /Seeds ??? 这个是所有分布式服务器节点的IP地址,如上面配置了3个IP即3个Cassandra节点 5. Liste
您可能关注的文档
- [表格类模板]基金管理6.ppt
- [表格类模板]学生的论文模板_.doc
- [表格类模板]学校重点单位档案样板1.doc
- [表格类模板]安全检查记录表.doc
- [表格类模板]员工安全管理.ppt
- [表格类模板]安全生产事故案例分析.ppt
- [表格类模板]安全规章制度.doc
- [表格类模板]安全规章制度大全.doc
- [表格类模板]安全表格.doc
- [表格类模板]店长报表分析与绩效考核.ppt
- 2025年天津市冷链物流基地配套道路建设可行性研究报告.docx
- 2025年天津市母婴护理会所专业化服务升级路径可行性研究报告.docx
- 2025年成都市私立医院医美抗衰中心创建可行性研究报告.docx
- 2025年成都市淡化海水在城市道路清洗领域的应用可行性研究报告.docx
- 2025年上海市环卫厨余垃圾生物处理技术应用可行性研究报告.docx
- 2025年天津市花西子针对户外运动妆容的可行性.docx
- 2025年上海市生物发电于秸秆炭化还田协同发电的可行性研究.docx
- 2025年天津市物造纸在可降解农用地膜领域的应用可行性研究报告.docx
- 2025年天津市无人值守充电站智能运维可行性研究报告.docx
- 2025年天津市竹荪种植连作障碍防治技术可行性研究报告.docx
文档评论(0)