大数据技术应用(国家) 知识点3:NoSQL的四大类型 NoSQL的四大类型.docxVIP

大数据技术应用(国家) 知识点3:NoSQL的四大类型 NoSQL的四大类型.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE1 / NUMPAGES3 NoSQL的四大类型 NoSQL的四大类型 摘 要:通过此文档来了解NoSQL数据库的四大类型,分别为键值(Key-Value)存储数据库、列存储数据库、文档型数据库、图形(Graph)数据库掌握NoSQL的基本概念及特点。 关键字:NoSQL;键值;数据库; 1. 键值(Key-Value)存储数据库 这一类数据库主要会使用到一个哈希表(如下图1),这个表中有一个特定的键和一个指针指向特定的数据。Key/value模型对于IT系统来说的优势在于简单、易部署。但是如果DBA只对部分值进行查询或更新的时候,Key/value就显得效率低下了。 相关产品:Redis、Riak、SimpleDB、Chordless、Scalaris、Memcached ?应用:内容缓存 ?优点:扩展性好、灵活性好、大量写操作时性能高 ?缺点:无法存储结构化信息、条件查询效率较低 ?使用者:百度云(Redis)、GitHub(Riak)、BestBuy(Riak)、Twitter(Ridis和Memcached) 图1 键值数据库示例 2. 列存储数据库 这部分数据库通常是用来应对分布式存储的海量数据。键仍然存在,但是它们的特点是指向了多个列。这些列是由列家族来安排的(如下图2)。 相关产品:BigTable、HBase、Cassandra、HadoopDB、GreenPlum、PNUTS 应用:分布式数据存储与管理 优点:查找速度快、可扩展性强、容易进行分布式扩展、复杂性低 使用者:Ebay(Cassandra)、Instagram(Cassandra)、NASA(Cassandra)、Facebook(HBase) 图2 列族数据库 3. 文档型数据库 文档型数据库的灵感是来自于Lotus Notes办公软件的,而且它同第一种键值存储相类似(如下图3)。该类型的数据模型是版本化的文档,半结构化的文档以特定的格式存储,比如JSON。文档型数据库可 以看作是键值数据库的升级版,允许之间嵌套键值。而且文档型数据库比键值数据库的查询效率更高。 相关产品:MongoDB、CouchDB、ThruDB、CloudKit、Perservere、Jackrabbit 应用:存储、索引并管理面向文档的数据或者类似的半结构化数据 优点:性能好、灵活性高、复杂性低、数据结构灵活 缺点:缺乏统一的查询语言 使用者:百度云数据库(MongoDB)、SAP(MongoDB) 图3 文档数据库 4. 图形(Graph)数据库 图形结构的数据库同其他行列以及刚性结构的SQL数据库不同,它是使用灵活的图形模型,并且能够扩展到多个服务器上。NoSQL数据库没有标准的查询语言(SQL),因此进行数据库查询需要制定数据模型。许多NoSQL数据库都有REST式的数据接口或者查询API。 相关产品:Neo4J、OrientDB、InfoGrid、GraphDB 应用:大量复杂、互连接、低结构化的图结构场合,如社交网络、推荐系统等 优点:灵活性高、支持复杂的图形算法、可用于构建复杂的关系图谱 缺点:复杂性高、只能支持一定的数据规模 使用者:Adobe(Neo4J)、Cisco(Neo4J)、T-Mobile(Neo4J) 图4 图形数据库 5. 共同特征 对于NoSQL并没有一个明确的范围和定义,但是他们都普遍存在下面一些共同特征: (1)不需要预定义模式:不需要事先定义数据模式,预定义表结构。数据中的每条记录都可能有不同的属性和格式。当插入数据时,并不需要预先定义它们的模式。 (2)无共享架构:相对于将所有数据存储的存储区域网络中的全共享架构。NoSQL往往将数据划分后存储在各个本地服务器上。因为从本地磁盘读取数据的性能往往好于通过网络传输读取数据的性能,从而提高了系统的性能。 (3)弹性可扩展:可以在系统运行的时候,动态增加或者删除结点。不需要停机维护,数据可以自动迁移。 (4)分区:相对于将数据存放于同一个节点,NoSQL数据库需要将数据进行分区,将记录分散在多个节点上面。并且通常分区的同时还要做复制。这样既提高了并行性能,又能保证没有单点失效的问题。 (5)异步复制:和RAID存储系统不同的是,NoSQL中的复制,往往是基于日志的异步复制。这样数据就可以尽快地写入一个节点,而不会被网络传输引起迟延。缺点是并不总是能保证一致性,这样的方式在出现故障的时候,可能会丢失少量的数据。 (6)BASE:相对于事务严格的ACID特性,NoSQL数据库保证的是BASE特性。BASE是最终一致性和软事务。

文档评论(0)

WanDocx + 关注
实名认证
文档贡献者

大部分文档都有全套资料,如需打包优惠下载,请留言联系。 所有资料均来源于互联网公开下载资源,如有侵权,请联系管理员及时删除。

1亿VIP精品文档

相关文档