NoSQL非关系型数据库发展和应用研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
NoSQL非关系型数据库发展和应用研究

NoSQL非关系型数据库发展和应用研究   摘 要:随着web2.0技术的兴起,NoSQL数据库得到了广泛的发展和应用。本文从初学者的角度出发,针对传统数据库的瓶颈,从读写速度、扩展性、运营成本、数据容量等方面对NoSQL数据库进行了分析,并对常见的几种NoSQL数据库进行了研究。   关键词:NoSQL;web2.0;Cassandra;MongoDB   中图分类号:TP311.13   1 NoSQL的起源和发展   当今的互联网时代是一个数据大爆炸的时代,电子商务、扫描文件、微博、音视频产生的数据文件每天都在快速增多。淘宝网每天被浏览的店铺和商品记录超过30亿条,每天的成交记录和客户评价有上千万条。优酷网每天收到的运营数据总量已达T级,目前的历史运营数据已达数百TB。据研究公司IDC预测,2020年全球的电子数据总量将达到35ZB,比当前的电子数据增加44倍。电子数据格式的多元化发展和规模的飞速增长,使传统数据库的技术面临着新的挑战,主要体现在以下几个方面:   1.1 读写慢。web2.0网站要实时处理用户的动态信息,在数据量达到一定规模时,关系型数据库由于并发的负载过高而容易发生死锁问题,此时系统的读写速度将会严重下滑。   1.2 数据库的扩展性不足。web2.0结构的数据库不方便直接扩展,对传统数据库的硬件升级,必须要做停机维护,这对web2.0网站来讲是不允许的。   1.3 建设和运营成本高。传统的企业级数据库价格惊人,在实际的项目中其价格随着系统规模的扩大而不断上升,所以在服务器集群中,高昂的建设和运营成本成为其发展的瓶颈。   1.4 有限的支撑容量。很多web2.0网站每天的信息量达上千万条,查询大的数据表格可以通过分表、分库等方法解决,但是由此也加重了数据备份和扩容的复杂性。   NoSQL是在新形势下出现的一种非关系型数据库的总称,它用全新的存储方式,简化了数据交互,减少编写、调试的代码量,对海量数据实现高效存储和高效访问,同时它的开源免费也降低了企业的运营成本,Google、Facebook、Twitter和Amazon等知名公司都开发和使用NoSQL系统来解决海量数据存储问题。   2 NoSQL数据库的优势   现在主流的NoSQL数据库有Cassandra、BigTable、Dynamo、SimpleDB、CouchDB、MongoDB和Redis等。Google公司使用的就是BigTable数据库,Amazon公司使用的是Dynamo数据库。NoSQL数据库对比传统关系数据库,其优势主要体现在以下几个方面:   2.1 数据库的开发效率高。在设计上NoSQL数据库和传统的数据库有很大的不同。传统应用程序的开发中,需要在内存数据结构和关系数据库的映射上花费大量的精力和时间。NoSQL数据库更符合应用程序的需求,部分NoSQL数据库可以在硬盘上直接操作,简化了数据的交互,减少了编写、调试程序的工作量。   2.2 数据库的扩展能力强。现在企业通常使用更小、更便宜的计算机组成集群来构建数据库,NoSQL数据库的设计正是针对服务器集群,所以更适合大规模数据的处理。   2.3 数据库的开发成本低廉。因为NoSQL数据库主要都是开源软件,所以没有昂贵的开发成本。在项目开发中很多企业为了节省成本而选择NoSQL数据库。   2.4 数据模型灵活。在关系数据库里,数据有固定的结构,通过各种操作互相关联,对大型的表格增删字段非常麻烦。NoSQL的存储只有一对键值或数组,无需事先建立字段,任何时候都可以存储自定义的数据格式。   3 NoSQL数据库的主要产品   3.1 Cassandra。Cassandra是由Facebook公司开发的开源式数据库,具有模式灵活、扩展性强、多数据中心识别、支持分布式读写等特点。Cassandra被Digg、Twitter等多家互联网知名公司使用,是目前非常流行的一种NoSQL数据库系统。用Cassandra存储数据,不必提前确定字段,在系统运行时可以随意增加和删除字段。用Cassandra扩展系统容量,可以为服务器集群直接指向新的成员,不需要重新启动,或者迁移数据。用Cassandra布置多数据中心识别,每条记录都会在备用的数据中心复制备份。用Cassandra的分布式读写功能,可以随时随地集中读写数据,不会有单点失败。   3.2 MongoDB。MongoDB是一种面向文档存储的优秀数据库系统,用c++语言编写。MongoDB的查询语法功能强大。使用类似JSON的BSON作为数据存储和传输的格式。BSON支持嵌套对象和数组。对复杂查询要求不高的情况下,MongoDB可以作为MySQL的替代品。它具有分布式的特点,支持海量数据

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档