Doris Colocation Join详解:原理、实现与使用指南.pdfVIP

  • 0
  • 0
  • 约2.76万字
  • 约 20页
  • 2026-02-13 发布于北京
  • 举报

Doris Colocation Join详解:原理、实现与使用指南.pdf

1.多进行join时如何提高效率?

建表的时候,指定当前这个表,属于哪个CG组

如果这个组中,包含了多

那么这多大概率是要进行join查询的,否则你也不会把这多通过相同的cg名称组

要求:

分桶的规则一定要一样:分桶的字段分桶的个数对每做相同规则的hash散列!

a表的第1个桶joinb表的第1个桶本地的小joina表的第

2个桶joinb表的第2个桶本地的小joina表的第3个桶

joinb表的第3个桶本地的小join

a表的第n个桶joinb表的第n个桶本地的小join

还有一个要求:

a表的第1个桶和b表的第1个桶

的数据,一定是在相同的节点!

所有的join的结果union起来,就是我们想要的结果!

唯一需要的操作:

1、创建表时,指定CG组2、创

建表时,指定分桶规则

只要两的CG名称相同,并且分桶规则一致,就能自动实现连接优化的效果。

2.ColocationJoin

ColocationJoin旨在为某些Join查询本地性优化,以减少数据在节点间的传输时间,加速查询。

本文档主要介绍ColocationJoin的原理、实现、使用方法和注意事项。

2.1.

ColocationGroup(CG):一个CG中会包含一张及以上的表。在同一个组内的表具有相同的

ColocationGroupSchema,并且具有相同的数据分片分布。

ColocationGroupSchema(CGS):用于描述一个CG中的表,以及与Colocation相关的通用

Schema信息。包括分桶列类型、分桶数以及副本数等。

2.2.原理

1.多张做join的时候怎么提高效率?

建表的时候,指定当前这个表,属于哪个CG组

如果这个组中,包含了多

那么这多大概率是要进行join查询的,否则你也不会吧这多通过相同的cg名称组

要求:

分桶的规则一定要一样:分桶的字段分桶的个数对每做相同规则的hash散列!

a表的第1个桶joinb表的第1个桶

本地的小join

a表的第2个桶joinb表的第2个桶

本地的小join

a表的第3个桶joinb表的第3个桶

本地的小join

a表的第n个桶joinb表的第n个桶

本地的小join

还有一个要求:

a表的第1个桶和b表的第1个桶

的数据,一定是在相同的节点!

所有的join的结果union起来,就是我们想要的结果!

唯一需要操作的事儿:

1、创建表的时候,指定CG组

2、创建表的时候,指定分桶规则

只要两的CG名称,而且分桶规则一样,就能自动达到join优化的效果

2.ColocationJoin

ColocationJoin旨在为某些Join查询本地性优化,来减少数据在节点间的传输耗时,加速查询。

本⽂档主要介绍ColocationJoin的原理、实现、使⽤⽅式和注意事项。

2.1.

ColocationGroup(CG):⼀个CG中会包含⼀张及以上的Table。在同⼀个Group内的Table有着

相同的ColocationGroupSchema,并且有着相同的数据分片分布。

ColocationGroupSchema(CGS):用于描述⼀个CG中的Table,和Colocation相关的通用

Schema信息。包括分桶列类型,分桶数以及副本数等。

2.2.原理

文档评论(0)

1亿VIP精品文档

相关文档