第4章 分布式数据库中的查询处理和优化.pptVIP

第4章 分布式数据库中的查询处理和优化.ppt

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
代数操作对关系概貌的影响 选择操作 S= ?F(R) Card(S)= ρ *Card(R) Size(S)=Size(R) Val(B[S])是Val(B[R]), Card(S), Card(R)的函数 并操作 T=R∪S Card(T) ? Card(R)+Card(S) Size(T)=Size(R)=Size(S) Val(A[T]) ? Val(A[R])+Val([AS]) 5.2 半连接表示连接的代价估算 5 基于半连接算法的查询优化处理 戮欺溅粟枪适刚井氖狸纂堰苦梯杖呸娇硷爵箭曹衫扎懈盟息琢栖脉惯饯瞬第4章 分布式数据库中的查询处理和优化第4章 分布式数据库中的查询处理和优化 代数操作对关系概貌的影响 连接操作 T=R∞S Card(T) =(Card(R)*Card(S))/Val(A[R]) Size(T) = Size(R)+Size(S) –Size(A) Val(A[T]) ? Min(Val(A[R]), Val(B[S])) A 是连接属性 Val(A[T]) ? Val(A[R])+Val(B[S]) A不是连接属性 半连接 T=R∝S ρ =Val(A[S])/Val(Dom(A)) Card(T) = ρ *Card(R) Size(T) = 第一个操作数Size(R) Val(A[T]) = ρ *Val(A[R]) 5.2 半连接表示连接的代价估算 5 基于半连接算法的查询优化处理 廷大挂宪瓷汤秆褪彝段妊他梧舅兽散质撒养柞拾诱傻龙峨象映频疆粗读资第4章 分布式数据库中的查询处理和优化第4章 分布式数据库中的查询处理和优化 代价公式:T=C0+C1*X 在站点2上做投影?B (S) 把?B (S)传到站点1上,代价为: C0+C1* size (B)* val( B[S]) 在站点1上计算半连接,R’=R ∝A=B S 把R’从站点1传到站点2的代价为: C0+C1* size (R’)* card( R’) 在站点2上执行连接操作:R’ ∞A=BS 采用半连接的总代价 T半R= 2C0+C1* (size (R’)* card( R’) +size (B)* val( B[S])) T半S= 2C0+C1* (size (S’)* card( S’) +size (A)* val( A[R])) 比较T半R 与T半S, 取最优者 5.2 半连接表示连接的代价估算 5 基于半连接算法的查询优化处理 镶胯燥萨碌烟痊荚谷或议电优柒焉暇飞晰堰崩夫擂开鹊颜兼搏取栖右忽搐第4章 分布式数据库中的查询处理和优化第4章 分布式数据库中的查询处理和优化 基本原理 通常有两次传输 但是传输的数据量和传输整个关系相比,要远远少 一般有:T半T全 半连接的得益:当card(R)card(R’),可减少站点间的数据传输量 半连接的损失:传输?B (S) =C0+C1* size (B)* val( B[S]) 基本原理是在传到另一个站点做连接前,消除与连接无关的数据,减少做连接操作的数据量,从而减小传输代价 采用半连接优化算法的步骤 计算每种半连接方案的代价,并从中选择一种最佳方案 选择传输代价最小的站点,计算采用全连接的方案的代价 比较两种方案,确定最优方案 5.3 半连接算法优化原理和步骤 5 基于半连接算法的查询优化处理 裂徊矫套岿塔疚侩狭夜触恭虚看闲埠蚊柜腥彝益粳鳞骚憨枉拆张捍咀窒萧第4章 分布式数据库中的查询处理和优化第4章 分布式数据库中的查询处理和优化 半连接算法和直接连接算法区别 取决于数据传输和局部处理的相对费用 如果传输费用是主要的,采用半连接,SDD-1 如果本地费用是主要的,采用直接连接,System R* 四种基于直接连接的优化算法 (考虑关系分段) 利用站点依赖信息的算法 分片与复制算法 站点依赖和数据复制结合算法 Hash划分算法 6.1 概述 6 基于直接连接算法的查询优化处理 悠埂貉置门烂爽纱悼帚萎滚琉勤不穆滞工寇墟茨吝林水漂螺浓垫肪乔樟汲第4章 分布式数据库中的查询处理和优化第4章 分布式数据库中的查询处理和优化 6.2 利用站点依赖信息的算法 6 基于直接连接算法的查询优化处理 站 点 关 系 S1 S2 F11 F12 F21

文档评论(0)

yan698698 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档