四分布式查询优化.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
四分布式查询优化

四 分布式查询优化 查询操作 选择 SL, 投影 PJ 连接 JN, 并 UN 笛卡尔积CP,差DF, 交等 连接优化方法 基于半连接的连接优化 (SDD-1算法) 基于直接连接的接连优化 半连接(Semi_Join) R S= ?R( R S) 半连接使关系简化 R’ = R SJ S ? R 直接SJ成立 R’’= (R SJ (R SJ T)) ? R 多次SJ仍然成立 例子 评价模型 关系的概貌 Card(R) 片段关系R的元组数目 Size(A) 属性A的大小(即字节数) Size(R) 片段关系的大小, 属性大小之和 Val(A[R]) 属性A在R中出现的不同值 基于半连接操作的连接操作 目标: 减少通讯量 R S ? (R S) S or R (S R) or (R S) (S R) 基于半连接操作的连接操作-续 R S = (R S) S 执行步骤如下: 发送?B S 到site r Cost = C0+C1*Size(B)*Val(B[S]) 在r站点执行SJ, 费用为零, 令R’=R SJA=B S 发送R’到site s, 费用 Cost = C0+C1*Size( R )*Card (R’) 在r站点计算JN,费用为零。 总费用 CSJ=2*C0+C1*((Size(B)*Val(B[S]) + Size( R)* Card (R’)) Example: R S A B A B A C R S 基于半连接优化 SJ 不对称 (R SJ S) JN S 的费用CSJ ( S SJ R) JN R 的费用C ’SJ CSJ’=2*C0+C1((Size(A)*Val(A[R]) + Size( S)* Card (S’)) 比较CSJ与CSJ’, 取最优者 SDD-1算法 通过考虑SJ程序的得益来计算优化 搜索相关SDD-1算法的论文 半连接算法的应用 半连接导致通讯次数增加和本地处理时间增加 半连接or直接连接 取决于数据传输和剧本处理的相对费用 低速网络-网络数据传输费用成本高-半连接 高速网络-本地处理费用成本高-直接连接 基于直接连接算法的查询优化 如下情况发生 查询结果关系中的属性很少,并且也不是某些连接条件属性 半连接的选择率较低(即缩减效果差) 考虑直接连接 考虑本地费用的算法 直接连接优化(R*算法) 本地连接费用 R JN S 设其一R为外关系 O, 另一S为内关系 I, I/o费用正比与读取的页面数, CPU费用正比与该JN结果的基数 直接连接优化-本地 处理方法有如下两种 嵌套循环 C嵌套= (Nout+Card(O)*Nin)*CI/o +Card(Result)*Ccpu Nout: 扫描O的页数 Nin: 对O的每个元组读取I的平均页数 合并扫描 C合并=(Nout+Nin)*CI/O+Csort(I)+Csort(O) +Card(Result)*Ccpu 每个关系只扫描一次,但增加了排序代价 直接连接优化-跨站点 数据传输方法 完整地传送 传送I, 需要送入I的一临时关系,I将被多次扫描 传送O, 则I在输入元组到来时使用它, 而不必存储O元组 需要时读取 只传输需要的元组,一次一个元组,每次传输都需要交换信息,无需临时存储器,适合高速网络 直接连接优化-续 本地处理+数据传输方法 嵌套, O完整地传送, 不存 C1=C嵌套+Cmes*[Card(O)*Size(O)/m] 合并, O完整地传送, 不存 C2=C合并+Cmes*[Card(O)*Size(O)/m] 直接连接优化-续 嵌套, I需要时读取 C3=C嵌套+Cmes*Card(O)*(1+[NI*Size(I)/m]) NI: 对每一个O元组发送请求, 满足该请求的平均元组个数 合并, I需要时读取 C4=C合并+Cmes*Val(A[O])*(1+[NI*Size(I)/m]) 直接连接优化-续 合并, I完整地传送, 使用前保存 C5=C合并+Cmes*[Card(I)*Siz

文档评论(0)

zhuwenmeijiale + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档