分布式数据库中的查询处理和优化ou.ppt

分布式数据库中的查询处理和优化ou.ppt

  1. 1、本文档共98页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分布式数据库中的查询处理和优化ou.ppt

查询q分解为q’和q’’,我们用SQL语句写出分解算法如下: // Break query q into q’ →q’’ q: SELECT R2.A2, R3.A3 ,…… , Rn.An FROM R1, R2, R3, ……, Rn WHERE P1(R1.A1’)AND P2(R1.A1, R2.A2, ……, Rn.An) 这里Ai和Ai’是关系Ri的属性组,P1是涉及关系R1的谓词,P2是涉及多个关系R2,R3,……,Rn的谓词,这样的一个查询可以分解成两个子查询语句: q’: SELECT R1.A1 INTO R1’ FROM R1 WHERE P1(R1.A1’) 其中R1’是一个临时关系,并且包含了q’’所需要的查询信息: q’’:SELECT R2.A2, ……, Rn.An FROM R1’, R2, R3,……, Rn WHERE P2(V1.A1, ……, Vn.An) 这一步可以有效的减少查询q’’所涉及关系的大小,另外,关系R1’可以事先存放在一个特殊的结构中以加速子查询的速度。 以此类推,继续将q’’进行分解,直到不能产生针对单一关系的查询为止。 7.3 INGRES中的查询优化算法 7典型分布式数据库系统中的查询优化策略和算法 分解阶段详细过程 1)选取当前多关系子查询中包含最小数据片段的子查询。 2)通过评估不同传输策略(传输哪个数据片段,传输到哪个站点)的代价,选取代价最小的传输策略,为该子查询确定要传输的数据片段和处理站点。 3)将相关的片段传输到相应的站点,在确定的站点上运行该子查询。 4)如果仍存在多关系子查询,返回步骤1)继续执行,如果不存在多关系子查询,算法终止。 7.3 INGRES中的查询优化算法 7典型分布式数据库系统中的查询优化策略和算法 查询处理和优化过程 总 结 分布式查询优化概述 分布式查询优化中的基础知识 分布式查询分类和层次结构 基于关系代数等价变换的查询优化处理 基于半连接算法的查询优化处理 基于直接连接算法的查询优化处理 典型分布式数据库系统中的查询优化策略和算法 代价公式:T=C0+C1*X 在站点2上做投影?B (S) 把?B (S)传到站点1上,代价为: C0+C1* size (B)* val( B[S]) 在站点1上计算半连接,R’=R ∝A=B S 把R’从站点1传到站点2的代价为: C0+C1* size (R’)* card( R’) 在站点2上执行连接操作:R’ ∞A=BS 采用半连接的总代价 T半R= 2C0+C1* (size (R’)* card( R’) +size (B)* val( B[S])) T半S= 2C0+C1* (size (S’)* card( S’) +size (A)* val( A[R])) 比较T半R 与T半S, 取最优者 5.2 半连接表示连接的代价估算 5 基于半连接算法的查询优化处理 基本原理 通常有两次传输 但是传输的数据量和传输整个关系相比,要远远少 一般有:T半T全 半连接的得益:当card(R)card(R’),可减少站点间的数据传输量 半连接的损失:传输?B (S) =C0+C1* size (B)* val( B[S]) 基本原理是在传到另一个站点做连接前,消除与连接无关的数据,减少做连接操作的数据量,从而减小传输代价 采用半连接优化算法的步骤 计算每种半连接方案的代价,并从中选择一种最佳方案 选择传输代价最小的站点,计算采用全连接的方案的代价 比较两种方案,确定最优方案 5.3 半连接算法优化原理和步骤 5 基于半连接算法的查询优化处理 半连接算法和直接连接算法区别 取决于数据传输和局部处理的相对费用 如果传输费用是主要的,采用半连接 如果本地费用是主要的,采用直接连接 四种基于直接连接的优化算法 (考虑关系分段) 利用站点依赖信息的算法 分片与复制算法 站点依赖和数据复制结合算法 Hash划分算法 6.1 概述 6 基于直接连接算法的查询优化处理 6.2 利用站点依赖信息的算法 6 基于直接连接算法的查询优化处理 站 点 关 系 S1 S2 F11 F12 F21 F22 R1 R2 ∪ ∞ ∞ 站点依赖 设关系Ri分片Fi1和Fi2, Rj分片Fj1和Fj2 关系Ri和Rj在属性A上满足条件

文档评论(0)

000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档