- 34
- 0
- 约4.4千字
- 约 21页
- 2016-12-19 发布于湖北
- 举报
1 2 表达式结果集统计大小的估计 执行计划选择 1.1、概述 1.2、选择运算结果大小估计 1.3、连接运算结果大小估计 2.1、概述 2.2、基于代价的连接顺序选择 2.3、启发式优化 1、表达式结果集统计大小的估计 1.1、概述 一个操作的代价依赖于它的输入的大小和其他统计信息。给定一个表达式,如a (b c),估计a与(b c)的连接代价,我们需要有一些统计信息的估计,如(b c)的大小。首先列出一些有关存储在数据库系统目录中的数据库关系的统计信息,然后使用这些统计信息去估计不同关系操作运算结果的统计信息。然而,该估计并不十分精确,因为估计是基于一个不严密的假设。因此,某个具有最小执行代价估计的执行计划可能事实上并不具有最小的实际执行代价。然而,实践经验告诉我们,即使估计并不准确,具有最小代价估计的计划通常等于或接近于实际最小执行计划。 数据库系统目录中存有数据库关系的下列统计信息 nr ,关系r的元组数 br ,包含关系r中元组的磁盘块数 lr ,关系r中每个元组的字节数 fr , 关系r的块因子—一个磁盘能容纳关系r中元组的个数 V(A,r),关系r中属性A出现的非重复值个数。 上面提到的统计信息是简化过的,现实中的优化器通常维护更深入的统计信息以提高对执行计划代价估计的准确度。大多数数据库将每个属性的取值分布另存为一张直方图。直方图中,每个属性的取值被分为若干个区间,并统计每个落入每个区间的元组数目。考虑一个关系person的属性age(0~99)可分成0~9,10~19,...,90~99.对于每个区间,我们记录那些age值落在该区间的person元组个数,以及落入该区间的不同年龄取值的个数。 如果没有这样的直方图信息,优化器将不得不假设属性值的分布是均匀的(即每个区间具有同样的计数值)。 1、表达式结果集统计大小的估计 1.2、选择运算结果大小的估计 对于一个选择运算结果大小的估计依赖于谓词。我们首先考虑一个单独的等值谓词,其次考虑一个单独的比较谓词,而后考虑谓词联合的情况。 σA=a(r):从关系数据库中选择出属性A的值为a的元组个数,相当于这样一条select语句 select * from r where A=a 为了估计这条语句执行后的结果集大小,有如下两个假设: (1)选择操作中值a会在一些记录中出现; (2)属性A的每个值以同样的概率出现; 第一条假设是代价估计的默认假设,然而第二条同等概率的假设通常是不现实的,我们有理由相信在选课系统中一些热门课程的course_id比冷门课程的course_id出现的可能性要大。尽管平均分布的假设通常不成立,但在许多情况下它是对现实的合理近似,并且能使我们的阐述相对简单。 基于以上两条假设,我们可以估计选择结果有 nr / V(A,r)个元组 如果属性A上有一个直方图,我们可以定位值a所在的区间,用该区间的频度代替nr,用该区间出现的不同属性值的个数替代V(A,r)。 1、表达式结果集统计大小的估计 σA≤v 从数据库中提取属性A的值小于等于v的元组 在进行代价估计时,用于比较操作的值v已知,可以做更精确的估计。属性A的最小值min(A,r),最大值manx(A,r)可存储到目录中。同样,假设值是均匀分布的,我们可以对满足条件A≤v的记录数进行下列估计: 若vmin(A,r), 则为0; 若v≧max(A,r),则为nr; 否则,为: 同样,如果属性A上存在直方图,我们就可以得到更精确的估计。 1、表达式结果集统计大小的估计 复杂选择: 合取——合取选择是形式如下的选择操作 σθ1?θ2...?θn(r) 我们按如下方式估计该选择的结果集大小:对每个θi,我们按照以前描述的那样估计选择σθi(r)的大小,记为si。因此关系中一个元组满足选择条件θi的概率为si/nr。上述概率成为选择σθi(r)的中选率。 假设:各条件相互独立,则某个元组满足全部条件的概率是全体概率的 乘积。 因此,我们可以估计满足全部选择条件的元组数量为: 1、表达式结果集统计大小的估计 析取——析取选择是形式如下的选择操作 σθ1νθ2...θn(r) 所有满足单个条件θi的记录的并满足析取条件。 如前所述,si/nr代表某元组满足条件θi的概率。元组满足整个析取式的概率为1减去元组不满足任何一个条件的概率,即: 用nr乘以这个概率,即得到满足该选择条件的元组数的估计 取反
您可能关注的文档
最近下载
- 现代饭店管理(课件).doc VIP
- 2024-2025学年广东省深圳市龙岗区六年级(上)期末语文试卷.pdf VIP
- 2025-2026学年内蒙古乌兰察布市初中联盟校八年级(上)期末数学试卷(含答案).pdf VIP
- (一模)哈三中2025届高三第一次模拟考试 化学试题(含答案).pdf
- Yamaha 雅马哈 乐器音响 PSR-E383 PSR-EW320 YPT-380 YPT-W320 Reference Manual 用户手册.pdf
- 医患沟通话术集锦.pdf VIP
- 2025年江苏常州初中学业水平考试英语试卷试题(含答案详解).docx VIP
- (一模)2026年合肥市高三第一次教学质量检测英语试卷(含答案)+听力音频+听力原文.docx
- 2023年山东泰安初中学业水平考试生物试卷真题(精校版).docx VIP
- 2024年山东青岛初中学业水平考试生物卷试题真题(精校打印版).pdf VIP
原创力文档

文档评论(0)