- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据库查询优化研究
摘要:随着信息技术的快速发展以及人们对信息依赖程度的提高,数据库在整个信息化建设中具有更加重要的作用。如何提高数据库的效率。特别是数据库查询的效率十分关键。论文分别研究了分布式数据库和并行数据库的查询优化方法。在分布式数据库中,论文侧重基本原理的分析,主要从基于关系代数的优化、基于直接连接查询的优化、半连接优化、索引优化以及查询优化搜索策略,这5个方面系统的论述了查询优化的方法、策略。在并行数据库部分,论文侧重于常见算法的研究,主要论述了基于查询树的传统优化方法、多重加权树优化方法、语义查询优化方法以及基于遗传的优化方法,该4类查询优化算法是目前并行数据库查询优化中应用最广的,代表了当前的研究水平。论文研究这两类典型的数据库查询优化算法,就是让我们能了解数据库优化的发展情况,有利于开发更加有效的查询优化技术。
关键词:分布式数据库;并行数据库;查询优化技术
中图分类号:TP312文献标识码:A文章编号:1009-3044(2010)21-6103-02
近年来,随着信息技术的快速发展,数据库技术应用越来越广泛,已成为信息化建设的核心。目前应用最广泛的数据库主要有两类,分别是分布式数据库和并行数据库。其中,由于网络技术的快速发展,分布式数据库已得到了广泛的应用。并行数据库在许多方面也得到了很好的应用。所以提高数据库的效率已成为迫切的任务。其中,查询是数据库中最常用操作,同时也是用户操纵、维护数据库中的数据的唯一途径。用户对数据库性能的直接感觉就是数据库管理系统对查询的处理是否高效、快速。查询处理的效率在很大程度上决定了数据库管理系统的性能。所以提高查询效率已成为数据库研究的热点。
现在我们看看,查询优化的发展:由CCA公司开发的SDD-1采用的查询优化方法是对逻辑关系用基本的运算操作来缩减;IBM公司设计的R*采用直接连接作为查询处理策略,同时为提高查询效率采用了动态规划的方法;加州大学伯克利分校研制的INGRES采用基于分解的优化算法;ORACLE是一款十分优秀的商业数据库,采用基于代价的优化或基于规则的优化找出一个执行代价较低的执行计划,由于在确定数掘的分布时,引入了直方图来描述数据值的分布而不是假设数据值是均匀分布的,从而大大提高了代价估计的精确度。可见,数据库查询优化已得到了快速的发展,从理论研究到了实践工程应用,并且在实际工程中的作用已经越来越重要了,特别是在实时数据库系统中尤为突出。数据库查询优化已成为数据库发展的一个重要研究方向。论文主要研究分布式数据库的查询优化问题,同时简单介绍并行数据库查询优化的常用方法及发展趋势。
1 数据库查询优化方法详解
为了让大家能清晰的了解数据库查询优化的主要方法,论文从两个方面来研究数据库的优化问题。首先介绍分布式数据库的查询优化技术,在该部分侧重于方法和策略的描述,不涉及到具体的算法。然后,研究一下并行数据库的查询优化技术,在该部分侧重于具体算法的论述。通过这两部分内容,就能较全面的为大家展现数据库查询优化技术的内涵。
1.1 常见分布式数据库查询优化方法
在分布式数据库中,我们进行查询优化的主要目标就是以最小的总代价,在最短的时间内获得所需的数据。它的实现既与通信时间有关,也与局部处理时间相关,根据不同的互连网络状况可以有不同的查询优化策略。总体上,可分为5个方面。
1) 基于关系代数的优化方法:数据库查询操作的基础就是关系运算,所以利用关系代数变换来实现查询优化是目前最常见的方法。其主要原理就是通过关系代数的等价变换,从而减少查询中的计算量,进而实现查询的优化。主要原则就是在关系运算中尽量避免直接执行运算量较大的笛卡儿积运算,而采用先执行关系代数表达式中的选择和投影操作,后把笛卡儿积操作之前和之后的一连串选择和投影合并起来一起做。这样就能减小运算量。该方法主要用于删除无用数据,从而减小运算,主要作为预处理使用。
2) 基于直接连接查询的优化方法:该方法的着眼点在于连接,通过研究关系的静态属性来构建一个最好的处理策略和连接顺序。在分布式数据库中,主要采用的优化策略为:
第一种,利用站点依赖信息来实现。就是在关系进行连接运算时,首先将同一站点上的子片段进行连接,然后再传输到目标站点上进行合并。该方法的主要优势是站点间无数据传送代价,并可利用本地索引信息加速连接。第二种是分片和复制算法。该方法就是将查询需要的关系的片段分配到选定的站点上,然后将其它关系进行复制,目的是让选定的站点上都搬出完整的关注,第三步就是在各站点上进行直接连接操作,最好将结合传到目的站点,该方法的主要优势是响应时间更短,但存在数据冗余的缺点。第三种是站点依赖和数据复制结合。该方法结合站点依赖信息和数据复制信息,减少关系片
文档评论(0)