- 0
- 0
- 约2.76万字
- 约 20页
- 2026-02-13 发布于北京
- 举报
1.多进行join时如何提高效率?
建表的时候,指定当前这个表,属于哪个CG组
如果这个组中,包含了多
那么这多大概率是要进行join查询的,否则你也不会把这多通过相同的cg名称组
要求:
分桶的规则一定要一样:分桶的字段分桶的个数对每做相同规则的hash散列!
a表的第1个桶joinb表的第1个桶本地的小joina表的第
2个桶joinb表的第2个桶本地的小joina表的第3个桶
joinb表的第3个桶本地的小join
a表的第n个桶joinb表的第n个桶本地的小join
还有一个要求:
a表的第1个桶和b表的第1个桶
的数据,一定是在相同的节点!
所有的join的结果union起来,就是我们想要的结果!
唯一需要的操作:
1、创建表时,指定CG组2、创
建表时,指定分桶规则
只要两的CG名称相同,并且分桶规则一致,就能自动实现连接优化的效果。
2.ColocationJoin
ColocationJoin旨在为某些Join查询本地性优化,以减少数据在节点间的传输时间,加速查询。
本文档主要介绍ColocationJoin的原理、实现、使用方法和注意事项。
2.1.
ColocationGroup(CG):一个CG中会包含一张及以上的表。在同一个组内的表具有相同的
ColocationGroupSchema,并且具有相同的数据分片分布。
ColocationGroupSchema(CGS):用于描述一个CG中的表,以及与Colocation相关的通用
Schema信息。包括分桶列类型、分桶数以及副本数等。
2.2.原理
1.多张做join的时候怎么提高效率?
建表的时候,指定当前这个表,属于哪个CG组
如果这个组中,包含了多
那么这多大概率是要进行join查询的,否则你也不会吧这多通过相同的cg名称组
要求:
分桶的规则一定要一样:分桶的字段分桶的个数对每做相同规则的hash散列!
a表的第1个桶joinb表的第1个桶
本地的小join
a表的第2个桶joinb表的第2个桶
本地的小join
a表的第3个桶joinb表的第3个桶
本地的小join
a表的第n个桶joinb表的第n个桶
本地的小join
还有一个要求:
a表的第1个桶和b表的第1个桶
的数据,一定是在相同的节点!
所有的join的结果union起来,就是我们想要的结果!
唯一需要操作的事儿:
1、创建表的时候,指定CG组
2、创建表的时候,指定分桶规则
只要两的CG名称,而且分桶规则一样,就能自动达到join优化的效果
2.ColocationJoin
ColocationJoin旨在为某些Join查询本地性优化,来减少数据在节点间的传输耗时,加速查询。
本⽂档主要介绍ColocationJoin的原理、实现、使⽤⽅式和注意事项。
2.1.
ColocationGroup(CG):⼀个CG中会包含⼀张及以上的Table。在同⼀个Group内的Table有着
相同的ColocationGroupSchema,并且有着相同的数据分片分布。
ColocationGroupSchema(CGS):用于描述⼀个CG中的Table,和Colocation相关的通用
Schema信息。包括分桶列类型,分桶数以及副本数等。
2.2.原理
原创力文档

文档评论(0)