- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 关系查询处理和查询优化 §9.1 关系数据库系统的查询处理 §9.2 关系系统的查询优化 §9.3 代数优化 §9.4 物理优化 §9.1 关系数据库系统的查询处理 查询处理的步骤 : 查询分析 查询检查 查询优化 查询执行 3.查询优化:选择一个高效执行的查询处理策略(代数优化和物理优化) 4.查询执行:依据优化器得到的执行策略生成查询计划,则代码生成器生成执行这个查询计划的代码 §9.1.2 实现查询操作的算法示例 一、选择操作的实现 1.简单的全表扫描方法 对查询的基本表顺序扫描,逐一检查每个元组是否满足选择条件,把满足条件的元组作为结果输出。对于小表,这种方法简单有效,对于大表来讲,其顺序扫描十分费时,效率很低 2.索引(或散列)扫描方法 如果选择条件中的属性上有索引,可以用索引扫描方法。通过索引先找到满足条件的元组主码或元组指针,再通过元组指针直接在查询的基本表中找到元组 [例1] Select * from student where 条件表达式; 这里条件表达式可能有以下几种情况: 1.C1:无条件 2.C2: Sno=‘200215121’ 3.C3: Sage20 4.C4: Sdept=‘CS’ AND Sage20 以C2为例:条件:Sno=‘200215121’,且Sno上有索引(或散列) ,则可以使用索引(或散列)得到Sno为‘200215121’元组的指针,然后通过元组指针在student表中检索到该学生 以C3为例:条件: Sage20 ,且Sage上有索引,则可以使用B+树索引找到Sage=20的索引项,以此为入口点在B+树的顺序集上得到Sage20 的所有元组指针,然后通过元组指针在student表中检索到年龄大于20的学生 二、连接操作的实现 [例2] select * from Student,SC where Student.Sno=Sc.Sno; 1.嵌套循环方法 最简单可行的算法。对外层循环的每一个元组,检索内层循环中的每一个元组,并检查这两个元组在连接属性上是否相等。如果满足连接条件,则串接后作为结果输出,直到外层循环表中的元组处理完为止 2.排序-合并方法 (1)首先对Student表和SC表按连接属性Sno排序 (2)取Student表中第一个Sno,依次扫描SC表中具有相同Sno的元组,把它们连接起来 (3)当扫描到Sno不相同的第一个SC元组时,返回Student表扫描它的下一个元组,再扫描SC表中具有相同Sno的元组,把它们连接起来。 重复上述步骤直到Student表扫描完。 这样Student表和SC表也只要扫描一遍。当然,执行时间要加上对两个表的排序时间。即使这样,使用预处理方法执行连接的时间一般仍大大减少 §9.2 关系系统的查询优化 §9.2.1 查询优化概述 查询优化的必要性 查询优化极大地影响RDBMS的性能。 查询优化的可能性 关系数据语言的级别很高,使DBMS可以从关系表达式中分析查询语义。 由DBMS进行查询优化的好处 用户不必考虑如何最好地表达查询以获得较好的效率,知道“干什么”,不用知道“怎么干” 系统可以比用户程序的优化做得更好 (1) 优化器可以从数据字典中获取许多统计信息,而用户程序则难以获得这些信息 (2)如果数据库的物理统计信息改变了,系统可以自动对查询重新优化以选择相适应的执行计划,在非关系系统中必须重写程序,而重写程序在实际应用中往往是不太可能的 (3)优化器可以考虑数百种不同的执行计划,而程序员一般只能考虑有限的几种可能性 (4)优化器中包括了很多复杂的优化技术 查询优化的总目标 选择有效策略,求得给定关系表达式的值,使得查询代价较小 代价模型 集中式数据库 单用户系统 总代价 = I/O代价 + CPU代价 多用户系统 总代价 = I/O代价 + CPU代价 + 内存代价 分布式数据库 总代价 = I/O代价 + CPU代价[+ 内存代价] + 通信代价 §9.2.2 一个实例(说明查询优化的好处) 例:列出所有选修课程C2的学生姓名。 ? SELECT DISTINCT Student.Sname FROM Student, SC WHERE Student.Sno=SC.Sno AND SC.Cno=2; 假设1:外存: Student:1000条,SC:10000条, 选修2号课程:50条 假设2:一个内存块装元组:10个Student, 或100个SC, 内存中一次可以存放: 5块Student元组, 1块SC元组
文档评论(0)