- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
形式语言与自动机理论--第四章查询优化
四.查询优化 主讲人:米凡 四 查询优化 4.1 查询处理 4.2 查询优化 4.3 代数优化 4.4 物理优化 4.5 小 结 1 查询处理步骤 RDBMS查询处理阶段 : 1. 查询分析 2. 查询检查 3. 查询优化 4. 查询执行 查询处理步骤(续) 2. 查询优化 查询优化:选择一个高效执行的查询处理策略 查询优化分类 : 代数优化:指关系代数表达式的优化 物理优化:指存取路径和底层操作算法的选择 查询优化方法选择的依据: 基于规则(rule based) 基于代价(cost based) 基于语义(semantic based) 一个实例 [例3] 求选修了2号课程的学生姓名。用SQL表达: SELECT Student.Sname FROM Student,SC WHERE Student.Sno=SC.Sno AND SC.Cno=‘2’; 假定学生-课程数据库中有1000个学生记录,10000个选课记录 其中选修2号课程的选课记录为50个 一个实例(续) 系统可以用多种等价的关系代数表达式来完成这一查询 Q1=πSname(σStudent.Sno=SC.Sno∧Sc.Cno=2 (Student×SC)) Q2=πSname(σSc.Cno=2 (Student SC)) Q3=πSname(Student σSc.Cno=2(SC)) 一个实例(续) 一、第一种情况 Q1=πSname(σStudent.Sno=SC.Sno∧Sc.Cno=2 Student×SC)) 1. 计算广义笛卡尔积 把Student和SC的每个元组连接起来的做法: 在内存中尽可能多地装入某个表(如Student表)的若干块,留出一块存放另一个表(如SC表)的元组。 把SC中的每个元组和Student中每个元组连接,连接后的元组装满一块后就写到中间文件上 从SC中读入一块和内存中的Student元组连接,直到SC表处理完。 再读入若干块Student元组,读入一块SC元组 重复上述处理过程,直到把Student表处理完 一个实例(续) 设一个块能装10个Student元组或100个SC元组,在内存中存放5块Student元组和1块SC元组,则读取总块数为 + =100+20×100=2100块 其中,读Student表100块。读SC表20遍,每遍100块。若每秒读写20块,则总计要花105s 连接后的元组数为103×104=107。设每块能装10个元组,则写出这些块要用106/20=5×104s 一个实例(续) 2. 作选择操作 依次读入连接后的元组,按照选择条件选取满足要求的记录 假定内存处理时间忽略。读取中间文件花费的时间(同写中间文件一样)需5×104s 满足条件的元组假设仅50个,均可放在内存 一个实例(续) 3. 作投影操作 把第2步的结果在Sname上作投影输出,得到最终结果 第一种情况下执行查询的总时间≈105+2×5×104≈105s 所有内存处理时间均忽略不计 一个实例(续) 二、 第二种情况 Q2=πSname(σSc.Cno=2 (Student SC)) 1. 计算自然连接 执行自然连接,读取Student和SC表的策略不变,总的读取块数仍为2100块花费105 s 自然连接的结果比第一种情况大大减少,为104个 写出这些元组时间为104/10/20=50s,为第一种情况的千分之一 2. 读取中间文件块,执行选择运算,花费时间也为50s。 3. 把第2步结果投影输出。 第二种情况总的执行时间≈105+50+50≈205s 一个实例(续) 一个实例(续) 假如SC表的Cno字段上有索引 第一步就不必读取所有的SC元组而只需读取Cno=‘2’的那些元组(50个) 存取的索引块和SC中满足条件的数据块大约总共3~4块 若Student表在Sno上也有索引 第二步也不必读取所有的Student元组 因为满足条件的SC记录仅50个,涉及最多50个Student记录 读取Student表的块数也可大大减少 总的存取时间将进一步减少到数秒 一个实例(续) 在Q3中 SC表的选择操作算法有全表扫描和索引扫描2种方法,经过初步估算,索引扫描方法较优 对于Student和SC表的连接,利用Student表上的索引,采用index join代价也较小,这就是物理优化 3.代数优化 查询树的启发式规则: 1. 选择运算应尽可能先做。在优化
文档评论(0)