大数据分析简介.pptVIP

  • 46
  • 0
  • 约 69页
  • 2017-05-13 发布于湖北
  • 举报
大数据分析简介

分布式文件系统 一个HDFS集群是由一个Namenode和一定数目的Datanodes组成。 非关系型数据库NoSQL 关系型数据库的局限性 难以满足高并发读写的需求 难以满足对海量数据高效率存储和访问的需求 难以满足对数据库高可扩展性和高可用性的需求 非关系型数据库NoSQL NoSQL 数据存储不需要固定的表结构,通常也不存在连接操作。在大数据存取上具备关系型数据库无法比拟的性能优势。 关系型数据库中的表都是存储一些格式化的数据结构,每个元组字段的组成都一样,即使不是每个元组都需要所有的字段,但数据库会为每个元组分配所有的字段。 非关系型数据库以键值对存储,它的结构不固定,每一个元组可以有不一样的字段,每个元组可以根据需要增加一些自己的键值对,这样就不会局限于固定的结构,可以减少一些时间和空间的开销。 非关系型数据库NoSQL 非关系型数据库NoSQL Bigtable的设计目的是可靠地处理PB级别的数据,并且能够部署到上千台机器上。Bigtable已经在超过60个Google的产品和项目上得到了应用,包括 Google Analytics、GoogleEarth等。 非关系型数据库NoSQL Bigtable是一个键值(key-value)映射。键有三维,分别是行键(row key)、列键(column key)和时间戳(timestamp),行键和列键都是字节串,时间戳是6

文档评论(0)

1亿VIP精品文档

相关文档