- 15
- 0
- 约 11页
- 2017-01-19 发布于浙江
- 举报
概述
随着海量数据问题的出现,海量管理能力,多类型,变化快,高可用性,低成本,高端可扩展性等需求给企业数据战略带来了巨大的挑战。企业数据仓库、数据中心的技术选型变得尤其重要!所以在选型之前,有必要对目前市场上各种大数据量的解决方案进行分析。
主流分布式并行处理数据库产品介绍
Greenplum
基础架构
Greenplum是基于Hadoop的一款分布式数据库产品,在处理海量数据方面相比传统数据库有着较大的优势。
Greenplum整体架构如下图:
数据库由Master Severs和Segment Severs通过Interconnect互联组成。
Master主机负责:建立与客户端的连接和管理;SQL的解析并形成执行计划;执行计划向Segment的分发收集Segment的执行结果;Master不存储业务数据,只存储数据字典。
Segment主机负责:业务数据的存储和存取;用户查询SQL的执行。
主要特性
Greenplum整体有如下技术特点:
Shared-nothing架构
海量数据库采用最易于扩展的Shared-nothing架构,每个节点都有自己的操作系统、数据库、硬件资源,节点之间通过网络来通信。
基于gNet Software Interconnect
数据库的内部通信通过基于超级计算的“软件”内部连接层基于通用的在节点间传递消息和数据采用高扩展协议,支持扩展到个以
原创力文档

文档评论(0)