- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GreenPlum数据库介绍
GreenPlum数据库介绍;GREENPLUM简介
大规模存储
GREENPLUM数据分布策略
并行加载数据
MapReduceSQL一体环境
GREENPLUM中的高可用方案
分析型应用体系架构
GREENPLUM方案的优势
GREENPLUM的应用场景
;GREENPLUM简介;GREENPLUM简介;GreenPlum主要由master host,segment host,interconnect三大部分组成。;Master节点:是整个系统的控制中心和对外的服务接入点,它负责接收用户SQL请求,将SQL生成查询计划并进行并行处理优化,然后将查询计划分配(dispatch)到所有的Segment节点进行并行处理,协调组织各个Segment节点按照查询计划一步一步地进行并行处理,最后获取到Segment的计算结果,再返回给客户端;从用户的角度看Greenplum集群,看到的只是Master节点,无需关心集群内部的机制,所有的并行处理都是在Master控制下自动完成的。Master节点一般只有一个或两个(互为备份)。
Interconnect:是Master节点及Segment节点、Segment节点与Segment节点之间的数据传输组件,它基于千兆交换机或万兆交换机实现数据在节点间的高速传输。
Segment节点:是Greenplum执行并行任务的并行运算节点,它接收Master的指令进行MPP并行计算,因此所有Segment节点的计算性能总和就是整个集群的性能,通过增加Segment节点,可以线性化得增加集群的处理性能和存储容量,Segment节点可以是1~10000个节点。
;Greenplum数据库通过将数据分布到多个节点上来实现大规模数据的存储。数据库的瓶颈经常发生在I/O方面,数据库的诸多性能问题最终总能归罪到I/O身上,久而久之,IO瓶颈成为了数据库性能的永恒的话题。
Greenplum采用分而治之的办法,将数据规律的分布到节点上,充分利用segment主机的IO能力,以此让系统达到最大的IO能力(主要是带宽)。
在greenplum中每个表都是分布在所有节点上的。Master host首先通过对表的某个或多个列进行hash运算,然后根据hash结果将表的数据分布到segment host中。整个过程中master host不存放任何用户数据,只是对客户端进行访问控制和存储表分布逻辑的元数据。
;GreenPlum数据分布策略;并行数据加载;MapReduceSQL一体环境;Greenplum中的高可用方案;默认情况下,greenplum的失败操作模式是“read-only模式,也就是说如果一个segment坏了,整个greenplum会变成只读,不能写了。如果模式是“continue”模式时,一个segment坏了的时候,数据库仍然可以继续工作。但由于segment的primary及mirror端的数据不同步了,所以恢复的时候需要花比较长的时间。对于Greenplum 3.X的版本,恢复时,需要把好的节点上的所有数据都copy到坏的机器上。而Greenplum4.0版本增加了功能,当备份节点坏的时候,主节点可以把增量数据记下来,这样当备份节点的主机恢复时,只需要恢复增量数据就可以了。 要让原先已offline的节点再加入集群中,需要重启集群。
对于Greenplum 3.X的版本,segment 的primary与mirror之间是做的逻辑同步,mirror端的数据库实际上也是可以读写的。而Greenplum4.0版本后,primary与mirror实际上是物理同步,这时mirror一直处于恢复状态,不能读也不能写。 ;分析型应用体系架构;Greenplum方案的优势;易用性
- 并行处理由系统自动完成– 无需人工干预
- 没有复杂的调优需求– 只需加载数据库和查询
扩展性
- 可线性扩展到10,000个节点
- 每增加一个节点,查询、加载性能都成线性增长
灵活性
- 完全并行处理支持SQL92, SQL99, SQL2003 OLAP,列数据库,透明压缩, MapReduce
- 支持任何schema (star, snowflake, 3NF, hybrid, etc)
- 丰富的扩展性和语言支??(Java , Perl, Python, R, C, etc);营销支撑、客户管理,数据仓库, BI,ODS,数据集市,数据挖掘,经营分析,网络分析,知识库管理,成本效益分析等项目
可以高效、低成本的存储、访问当前及历史数据
- 利用Greenplum最低的TB数据成本(高性价比)
- 利用Greenplum高效的数据加载能力,迅速将长期积累的数据入库
- 利用Greenplum的并行数
您可能关注的文档
- 都是品牌惹的祸(It's all about brands).doc
- 部分常用导线、电缆安全载流量表(综合)(Some of the commonly used wire and cable safety flow meter (integrated)).doc
- 鄂尔多斯市创先争优(Ordos city chuangxianzhengyou).doc
- 酉阳方言知多少(How much is the Youyang dialect).doc
- 配偶权的侵权及其民法救济(The infringement of spouse right and its civil remedies).doc
- 配电检修规程 - 制度规范 - 设备管理网——中国工业设备维修的专业门户!(Code of practice for power distribution maintenance -- system specification -- equipment management network -- professional gateway of industrial equipment maintenance in china!).doc
- 酒业小知识和市场调查提要(Wine industry small knowledge and Market Research Summary).doc
- 酒吧中英文对照(Chinese and English Bar).doc
- 酒店如何有效发掘客源(How can the hotel effectively tap the tourists).doc
- 郭鹤年的香格里拉(Guo Henian's Shangri-La).doc
文档评论(0)