GreenPlum 数据库集群安装说明及使用手册v1.0
GreenPlum数据库集群安装说明及使用手册开心十二月总结****年**月**日目录体系结构介绍 Greenplum数据库产品——下一代数据仓库引擎和分析方法Greenplum公司是企业数据云计算解决方案的创始人,为客户提供灵活的数据商业智能和分析方法。能够以极低的成本代价,提供业界领先的计算性能。客户遍及美国知名企业:Nasdaq、NYSE、Ebay、Fox Interactive Media……等。Greenplum公司的Greenplum数据库产品是用于建造下一代数据仓库和巨大规模分析系统的软件解决方案。支持SQL和MapReduce并行处理,更适合管理TB级~PB级的海量数据,并以极低的成本代价提供了业界领先的计算性能。使用独有的sharing-nothing MPP架构,服务器的集群工作起来,就像是一个独立的超级计算机!优化了BI和分析方法,自动化分区数据和并行查询,比传统数据库执行速度提高10倍~100倍!Greenplum数据库的特色:大规模地并行分析处理能力Greenplum数据库可以跨越100~1000颗CPU,实现统一的并行操作引擎,让处理过程尽可能地靠近数据。Greenplum是业界最快的和最普及的高端数据仓库解决方案!用传统方式需花费数天才能完成的复杂查询,现在使用Greenplum只需要几分钟完成!核心的MPP架构Greenplum数据库提供数据和查询的自动化并行:数据被自动分区跨越集群中的所有节点;查询以高度协作的方式,在集群的所有节点上执行。高速PB级数据装载利用独有的MPP Scatter/Gather Streaming技术,实现高速的数据装载。每增加1个节点,每小时装载吞吐量提高4TB!数据库内部压缩利用业界领先的压缩技术提高性能和降低存储空间。在有效较少1/3~1/10空间的同时,相应地提高了I/O性能。多级容错能力Greenplum数据库利用多级冗余技术,在硬件或软件故障时,保障操作可以继续执行。在线系统扩展为提高存储容量、处理性能,增加新的服务器到集群中,扩展的操作在后台完成,数据库可以继续保持正常工作状态不受影响。处理性能和存储容量,随服务器的个数增加成正比显著提高!自有的MapReduce技术MapReduce是Google和Yahoo的大规模数据分析方法。Greenplum使用独有的并行引擎执行MapReduce。Greenplum数据库架构原理解密:Greenplum数据库通过分布负载到多个服务器主机,实现操作存储和处理大规模的数据。数据库实际上由1个Master服务器和若干个独立的Segment服务器组成,一起协调工作,每个服务器都是独立的PostgreSQL数据库。如图1所示,Master服务器是数据库的入口,验证客户端,处理输入的SQL,分布工作到若干Segment服务器,统一协调各个Segment返回的结果,汇总最终结果返回客户端。Master不存储任何用户数据,只有全局系统视图。图1:Greenplum数据库架构如图2所示,Segment服务器是真正数据存储的地方,并承担主要的查询工作。用户数据(表、索引)被分布存储到有效的若干Segment,通过Hash算法,每个Segment存放数据的不同部分。图2:Segment服务器真正存储数据图3展示了一套完整的Greenplum数据仓库实施架构示例。独立的Master服务器,通过千兆网络连接在一起的若干Segment服务器,每个Segment服务器挂载独立的RAID存储。服务器基于X86-64位硬件平台,安装Linux操作系统,获得极高的性价比。图3:Greenplum数据库完整实施架构示例图4记录了一次完整的MPP并行查询过程。Master作为查询调度器,为客户端提供连接工作;Segment独立管理数据片和数据操作。调度过程如下:1.Master验证客户端用户。2.Master连接到所有远程Segment实例。3.Master解析SQL语句。4.Master建立1个优化的并行查询计划。5.Master分布查询计划到所有的Segment实例。6.Master协调查询计划在所有Segment上并行执行。7.Master收集所有Segment的查询结果并返回到客户端。图4:一次查询调度过程Greenplum独有的Sharing-Nothing架构:数据仓库在执行全表扫描查询时,通常速度被存储的带宽限制,即瓶颈大多集中在I/O。Greenplum的Sharing-Nothing架构物理分离数据,存储到若干Segment服务器,每个Segment使用多个、专用的、独立的、高速的通道独立连接到磁盘,并把管理数据库资源:buffer、lock、block的职责委派到各个Segment,不使用Master统一管理资源!从图5中可以看出
您可能关注的文档
- great scientists热身和阅读第一单元.ppt
- Greenhouse Effect(温室效应).pptx
- Green_trade_barrier绿色贸易堡垒.ppt
- Greenplum MR 企业级Hadoop _CMCC-FuJian.pptx
- Greeting Cards问候语.ppt
- GREissue高频作文实用资料,提纲与范文超完整总结版.docx
- GRE写作话题分类词伙.doc
- GRE分类Issue提纲及部分详文.doc
- GRE全部Argument提纲.doc
- GRE最新最全数学词汇.doc
- 伟明环保-市场前景及投资研究报告-境内业务稳健运行,印尼市场贡献边际增量.pdf
- 桂东县法院系统招聘考试真题2025.pdf
- 贵州省黔南布依族2026年中考三模物理试题及答案.pdf
- 贵州省黔南州2026年中考语文二模试卷附答案.pdf
- 贵州省铜仁市2026年中考语文二模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套完整答案详解.docx
- 贵州省毕节市2026年中考语文一模试卷附答案.pdf
- 贵州省贵阳市南明区2026年中考语文一模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套参考答案详解.docx
- 贵州省贵阳市白云区2026年中考二模物理试题附答案.pdf
最近下载
- 基于Boost电路的MPPT光伏发电系统:原理、设计与应用.docx VIP
- 普通国省道智慧公路建设总体技术规范.pdf VIP
- 2025中考数学冲刺抢押秘籍(四川成都版)猜押08一次函数与反比例函数综合(成都版)(解析版).docx
- 《重庆市银行业金融机构现金清分业务服务外包标准》.docx VIP
- 2025年安徽省C20教育联盟中考数学“功夫”试卷(二)+答案解析.pdf VIP
- 高考英语--词性转换背诵版+默写版+ 高三英语.docx VIP
- 2025年包头市土默特右旗小升初语文秋季入学摸底测试卷(含答案).doc VIP
- 2025中考数学冲刺抢押秘籍(四川成都版)猜押10二次函数综合应用解答题压轴(成都版)(解析版).docx
- 2025年护理抢救工作制度考试题含答案.docx VIP
- 2025中考数学冲刺抢押秘籍(四川成都版)猜押06解直角三角形及其应用(成都版)(解析版).docx VIP
原创力文档

文档评论(0)