第4章 分布式数据库中的查询处理及优化.ppt

第4章 分布式数据库中的查询处理及优化.ppt

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
7.2 R*中的查询优化算法 7典型分布式数据库系统中的查询优化策略和算法 第三种策略:将关系S中满足连接条件的元组传输到关系R所在的站点上,在这种情况下,首先要将连接的条件传输到关系S中,从中筛选出满足条件的元组,根据前面的假设,满足条件的元组个数为s个,每当一个元组到达R所在的站点时就进行连接操作,则花费的总时间为: Total_cost=LT(Retrieve card(S) tuples from S) +CT(Length(A))* Card(R) +LT(Retrieve s tuples from S)* Card(R) +CT(s * Length(S))* Card(R) 第四种策略:将两个关系都传输到第三个站点上,并在这个站点上进行连接。首先将关系S传输到第三个站点上,并在这个站点上保存关系S的临时副本(关系T),再将关系R传输到第三个站点上,并且当R中每一个元组到达时就进行连接,则花费的总时间为: Total_cost=LT(Retrieve Card(S) tuples from S) +CT(Size(S)) +LT(Store Card(S) tuples in T) +LT(Retrieve Card(R) tuples from R) +CT(Size(R)) +LT(Retrieve s tuples from T)* Card(R) INGRES是早期的关系数据库系统,来自于加利福尼亚大学伯克利分校的一个研究项目,该项目开始于 20世纪70 年代早期,在 80 年代早期结束。 在集中式INGRES系统中,采用一种动态的、解释性的查询优化算法。这个算法主要分为两个主要步骤: 分解阶段:将含有多个变量的查询分解为一系列的只含有一个变量的单关系查询。 优化阶段:通过执行每一个单关系查询,利用启发式方法选择一个初始化的执行顺序,并通过中间关系的大小来确定查询执行的顺序。 7.3 INGRES中的查询优化算法 7典型分布式数据库系统中的查询优化策略和算法 查询q分解为q’和q’’,我们用SQL语句写出分解算法如下: // Break query q into q’ →q’’ q: SELECT R2.A2, R3.A3 ,…… , Rn.An FROM R1, R2, R3, ……, Rn WHERE P1(R1.A1’)AND P2(R1.A1, R2.A2, ……, Rn.An) 这里Ai和Ai’是关系Ri的属性组,P1是涉及关系R1的谓词,P2是涉及多个关系R2,R3,……,Rn的谓词,这样的一个查询可以分解成两个子查询语句: q’: SELECT R1.A1 INTO R1’ FROM R1 WHERE P1(R1.A1’) 其中R1’是一个临时关系,并且包含了q’’所需要的查询信息: q’’:SELECT R2.A2, ……, Rn.An FROM R1’, R2, R3,……, Rn WHERE P2(V1.A1, ……, Vn.An) 这一步可以有效的减少查询q’’所涉及关系的大小,另外,关系R1’可以事先存放在一个特殊的结构中以加速子查询的速度。 以此类推,继续将q’’进行分解,直到不能产生针对单一关系的查询为止。 7.3 INGRES中的查询优化算法 7典型分布式数据库系统中的查询优化策略和算法 分解阶段详细过程 1)选取当前多关系子查询中包含最小数据片段的子查询。 2)通过评估不同传输策略(传输哪个数据片段,传输到哪个站点)的代价,选取代价最小的传输策略,为该子查询确定要传输的数据片段和处理站点。 3)将相关的片段传输到相应的站点,在确定的站点上运行该子查询。 4)如果仍存在多关系子查询,返回步骤1)继续执行,如果不存在多关系子查询,算法终止。 7.3 INGRES中的查询优化算法 7典型分布式数据库系统中的查询优化策略和算法 查询处理和优化过程 总 结 分布式查询优化概述 分布式查询优化中的基础知识 分布式查询分类和层次结构 基于关系代数等价变换的查询优化处理 基于半连接算法的查询优化处理 基于直接连接算法的查询优化处理 典型分布式数据库系统中的查询优化策略和算法 代数操作对关系概貌的影响 选择操作 S= ?F(R) Card(S)= ρ *Card(R) Size(S)=Size(R) Val(B[S])是Val(B[R]), Card(S), Card(R)的函数 并操作 T=R∪S Card(T) ? Card(R)+Card(S) Size(T)=Size(R)=Size(S) Val(A[T]) ? Val(A[R])+Val([AS]) 5.2 半连接表示连接的代价估算 5 基于半连接算法的查询优

文档评论(0)

xiaofei2001128 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档