- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章_分布式数据库中的查询处理和优化_2
000000000000 1 作 业 下次课程内容基于直接连接算法的查询优化处理 * Content Layouts 软件学院 L/O/G/O 褚龙现 chulongxian@126.com 第3章 分布式数据库中的查询处理和优化 回顾-分布式查询优化准则和代价分析 准则: 使得通讯费用最低和响应时间最短,即以最小的总代价,在最短的响应时间内获得需要的数据。 通讯费用与所传输的数据量和通信次数有关 响应时间和通信时间有关,也与局部处理时间有关 查询代价分析 远程通讯网络 局部处理时间可以忽略不计,减少通讯代价是主要目标 高速局域网 传输时间比局部处理时间要短很多,以响应时间作为优化目标,局部处理时间是关键 回顾-分布式查询优化中的基础知识 关系代数知识回顾 用关系代数和SQL语句表示一个查询 查询树 等价变换规则的概念和术语 分布式查询的分类与层次结构 基于关系代数等价变换的查询优化处理 1 2 教 学 内 容 基于半连接算法的查询优化处理 3 教 学 目 标 难 点 掌握基于关系代数等价变换的查询优化处理 重 点 掌握基于半连接算法的查询优化处理 掌握分布式查询的层次结构 水平分片和垂直分片的查询优化 半连接表示连接的代价估算 3.3 分布式查询的分类与层次结构 分布式查询分类 局部查询:只涉及本地单个站点的数据, 优化同集中式 选择和投影早做,中间结果大大减少 连接前进行预处理(属性排序、属性索引) 同时执行一串投影和选择操作 远程查询:也只涉及单个站点的数据, 但要远程通讯, 选择站点 选择查询应用最近的冗余分配站点 全局查询:涉及多个站点数据, 优化复杂 3.3 分布式查询的分类与层次结构 分布式查询分类 具体化 对查询进行分解,确定查询使用的物理副本,落实查询对象 非冗余具体化,所有要访问对象只有一个副本 冗余具体化,多个副本,研究如何选择副本,使通信代价最小 确定操作执行的顺序 确定二元操作连接和并操作的顺序 先执行所有连接操作,再执行并操作 先执行部分并操作,再执行连接操作 选择和投影尽可能早进行 确定操作执行的方法 把若干个操作连接起来在一次数据库访问中,确定可用的访问路径 连接方法在查询优化中起着重要作用 确定执行的站点 执行站点不一定是发出查询的站点 考虑通讯费用和执行效率 全局查询 3.3 分布式查询的分类与层次结构 分布式查询处理的层次结构 查询分解 将查询问题(SQL)转换成一个定义在全局关系上的关系代数表达式 需要从全局概念模式中获得转换所需要的信息 数据本地化 具体化全局关系上的查询,落实到合适的片段上的查询 即将全局关系上的关系代数表达式变换为相应片段上的关系代数表达式 全局优化 输入的是分片查询,优化目标是寻找一个近于最优的执行策略(操作次序) 输出是一个优化的、片段上的关系代数查询 局部优化 输入是局部模式 它由该站点上的DBMS进行优化 3.3 分布式查询的分类与层次结构 分布式查询处理的层次结构 查询分解 数据本地化 全局优化 局部优化 分布关系上的查询表达 分布关系上的代数表达 分段关系查询表达 带有通讯操作的段查询优化 优化的局部查询表达 全局模式 段模式 段的统计数据 局部模式 控制站点 本地站点 3.4 基于关系代数等价变换的查询优化处理 基本原理和实现方法 基本原理 查询问题—〉关系代数表达式 分析得到查询树 进行全局到片段的变换得到基于片段的查询树 利用关系代数等价变换规则的优化算法,尽可能先执行选择和投影操作 优化算法 连接和合并尽可能上提(树根方向) 选择和投影操作尽可能下移(叶子方向) 3.4 基于关系代数等价变换的查询优化处理 基本原理和实现方法 实现步骤和方法 转换一:查询问题—〉关系代数表达式 转换二:关系代数表达式—〉查询树 转换三:全局查询树分拆成片段查询树 优化:利用关系代数等价变换规则的优化算法,优化查询树,进而优化查询 3.4 基于关系代数等价变换的查询优化处理 查询优化处理 - 水平分片 全局关系 S(S#, SNAME, AGE, SEX)和SC(S#, C#, GRADE)被水平分片 h h S SC S1: SEX=‘M’ 男学生全体 S2: SEX=‘F’ 女学生全体 SC1:C#=20 课程号=20 SC2:C# 20 课程号20 查询问题:查找至少有一门功课成绩在90分以上的男生姓名 ?SNAME(?SEX=‘M’ and GRADE90(?S.S #=SC.S# (S×SC))) 3.4 基于关系代数等价变换的查询优化处理 SC1 ? SNAME S.S#=SC.S# S.S#=SC.S# ? S#, SNAME ? S#, S
文档评论(0)