?
?
PB级数据仓库性能调优
?
?
【摘要】 众所周知,数据量大了之后,性能是大家关注的一点,所以我们在业务开发的时候,特别关注性能,做为一个架构师,必须对性能要了解,要懂。才能设计出高性能的业务系统。
一、GaussDB分布式架构
所谓集群是将多台物理服务器组建成一个逻辑平台,对外展现一个集群平台的形式。
所谓分布式架构是将数据分而治之。以逻辑进行划分,将数据存放在不同的物理节点。
CN:协调节点 负责接收来自应用的访问请求,并向客户端返回执行结果。Coordinator负责分解任务,并调度任务分片在DataNode上并行执行。
CN:SQL语句的解析和任务规划,把具体的任务下发给DN结构
GTM:生成和维护全局事务ID、事务快照、时间戳等需要全局唯一的信息。
DN:数据节点,负责存储业务数据(支持行存、列存、混合存储)、执行数据查询任务以及向Coordinator返回执行结果。【不单存储还负责计算】
一台物理机【2-4个DN】
Coorinator做任务的规划 分发,规划完之后,把具体的任务抛给计算节点。
Crew3 Worker1和Crew3 Worker2就是任务树中的叶节点就是数据的扫描任务,接受下级任务的数据输入,向上级任务输出数据。
Crew2 Worker1和Crew2 Worker2中间的节点就是各种数据运算任务,如Hash计算,Join操作,聚集操作和排序
您可能关注的文档
最近下载
- 天然气发电机组培训手册.pdf VIP
- 第三章 流体动力学原理.ppt VIP
- 基于Java的快递管理系统的设计与实现.docx VIP
- 图画捉迷藏图片下载直接打印可用.doc VIP
- 甲醇供货合同.docx VIP
- SYT 6565-2018- 石油天然气开发注二氧化碳安全规范.pdf VIP
- 2025贵州黔西南州望谟县消防救援大队招聘政府专职消防文员1人模拟试卷附答案详解.docx VIP
- 2026年春贵州人民版(2024)小学综合实践活动五年级下册(全册)教案(附目录).docx
- 第九届全国青年数学教师优秀课课件 陕西—杨宪伟—课件—椭圆及其标准方程.pptx VIP
- 长郡中学2023届高三第三次月考数学试卷.pdf VIP
原创力文档

文档评论(0)