- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据库原理件--09_关系查询处理和查询优化
An Introduction to Database System 第九章 关系查询处理和查询优化 9.1 关系数据库系统的查询处理 9.2 关系数据库系统的查询优化 9.3 代数优化 9.4 物理优化 9.5 小结 9.1 关系数据库系统的查询处理 9.1.1 查询处理步骤 9.1.2 实现查询操作的算法示例 9.1.1 查询处理步骤 查询分析:对查询语句进行扫描、词法分析和语法分析,判断它是否符合SQL语法规则。 查询检查:根据数据字典对合法的查询语句进行语义检查,即查询语句中的数据库对象,如属性名、关系名,是否存在和是否有效。还要根据数据字典中的用户权限和完整性约束定义对用户的存取权限进行检查。通过后便把SQL查询语句转换成等价的关系代数表达式,用查询树(语法分析树)来表示。 9.1.1 查询处理步骤(续) 3. 查询优化:从多个可供选择的执行策略和操作算法中选择一个高效执行的查询处理策略。按优化的层次一般可分为代数优化和物理优化。 代数优化:指关系代数表达式的优化,即按照一定的规则,改变代数表达式中操作的次序和组合,使查询执行更高效。 物理优化:指存取路径和底层操作算法的选择。 9.1.1 查询处理步骤(续) 4. 查询执行:依据优化器得到的执行策略生成查询计划,由代码生成器生成执行这个查询计划的代码。 见课本P264 图9.1 9.1.2 实现查询操作的算法示例 一、选择操作的实现 [例1] select * from student where 条件表达式 条件表达式的几种情况: C1:无条件 C2:sno=‘200215121’ C3:sage20 C4:sdept=‘CS’ and sage20 9.1.2 实现查询操作的算法示例(续) 1.简单的全表扫描方法 对基本表进行顺序扫描,逐一检查每个元组是否满足选择条件。对于小表简单有效,对于大表则效率低下。 2.索引扫描方法 通过索引先找到满足条件的元组主码或元组指针,再通过元组指针直接在查询的基本表中找到元组。 选择操作的实现(续) [例1-C2]以C2为例,Sno=‘200215121’,并且Sno上有索引 使用索引得到Sno为‘200215121’ 元组的指针 通过元组指针在student表中检索到该学生 [例1-C3]以C3为例,Sage20,并且Sage上有B+树索引 使用B+树索引找到Sage=20的索引项,以此为入口点在B+树的顺序集上得到Sage20的所有元组指针 通过这些元组指针到student表中检索到所有年龄大于20的学生。 选择操作的实现(续) [例1-C4]以C4为例,Sdept=‘CS’ AND Sage20,如果Sdept和Sage上都有索引: 算法一:分别用上面两种方法分别找到Sdept=‘CS’的一组元组指针和Sage20的另一组元组指针 求这2组指针的交集 到student表中检索 得到计算机系年龄大于20的学生 算法二:找到Sdept=‘CS’的一组元组指针, 通过这些元组指针到student表中检索 对得到的元组检查另一些选择条件(如Sage20)是否满足 把满足条件的元组作为结果输出。 9.1.2 实现查询操作的算法示例(续) 二、连接操作的实现 [例2] select * from student,sc where student.sno=sc.sno 嵌套循环方法 排序--合并方法 索引连接方法 Hash join方法 9.1.2 实现查询操作的算法示例 1、嵌套循环方法 9.1.2 实现查询操作的算法示例 2、排序合并方法 9.1.2 实现查询操作的算法示例 3、索引连接方法 9.1.2 实现查询操作的算法示例 4、Hash Join方法 9.2 关系数据库系统的查询优化 9.2.1 查询优化概述 查询优化在关系数据库系统中有着非常重要的地位 关系查询优化是影响RDBMS性能的关键因素 9.2.1 查询优化概述(续) 由DBMS进行查询优化的好处 用户不必考虑如何最好地表达查询以获得较好的效率 系统可以比用户程序的优化做得更好 (1) 优化器可以从数据字典中获取许多统计信息,而用户程序则难以获得这些信息。 9.2.1 查询优化概述(续) (2)如果数据库的物理统计信息改变了,系统可以自动对查询重新优化以选择相适应的执行计划。 在非关系系统中必须重写程序,而重写程序在实际应用中往往是不太可能的。 (3)优化器可以考虑数百种不同的执行计划,而程序员一般只能考虑有限的几种可能性。 (4)优化器中包括了很多复杂的优化技术。 9.2.1 查询优化概述(续) RDBMS通过某种代价模型计算出各种查询执行策略的执行代价,然后选取代价最小的执行方案 集中
文档评论(0)