分布式数据库查询系统优化探讨.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式数据库查询系统优化探讨

分布式数据库查询系统优化探讨   摘要:随着数据存储的分布性需求日益广泛,对分布式数据的管理和访问就成为数据库技术必须解决的问题。本文主要论述分布式数据库查询的概念特点,分布式数据库查询优化技术,并从它的优化技术进行深入探讨,对系统实现做了一定的论述,并进行了部分的程序实现。   关键词:分布式 数据库 查询系统 优化      引言   分布式数据库是在上世纪7O年代中期,随着各企业、团体和单位对数据库更广泛地使用以及数据库技术和计算机网络发展成熟而产生的。由于分布式数据库克服了集中式数据库的许多缺点,并且自然地适应于许多单位地理上分散而逻辑上统一的组织结构,因此,多年以来从理论到实践都得到了迅速发展,并取得了决定性成果。分布式数据库是一个逻辑上完整而物理上分散在若干台互相连接着的计算机上的数据库系统,各组件分布在网络的各个节点上,依靠特定的更新和检索机制进行数据库分布,数据库的所有性能都会显著增强。   1.分布式数据库查询的定义和特点   1.1 分布式数据库查询的定义   分布式数据库系统(Distributed Data Base System,DDBS)是物理上分布而逻辑上集中的数据库系统。物理上分布是指分布式数据库系统中的数据分布在由网络连接起来的、地理位置分散的不同站点上;逻辑上集中是指各数据库站点之间在逻辑上是一个整体,并由统一的数据库管理系统进行管理,同时各站点又具有管理本地数据的能力。   分布式数据库系统有两个重要的组成部分:分布式数据库(Distributed Data Base,DDB)和分布式数据库管理系统(Distributed Data Base Management System,DDBMS)。分布式数据库是计算机网络中各站点上数据库的逻辑集合。也就是分布式数据库是一组结构化的数据集合,在逻辑上属于同一个系统,在物理上分布在计算机网络的不同站点上,是集中与分布的统一。   1.2分布式数据库查询的特点   根据分布式数据库系统的定义,分布式数据库系统具有如下四个基本特点:   (1)物理分布性。数据不是存在一个站点上,而是存储在计算机网络的多个站点上。   (2)逻辑整体性。数据物理分布在各个场地,但逻辑上是一个整体,它们被分布式数据库系统的所有数据物理分布在各个场地,它们被分布式数据库系统的所有全局用户共享,并由一个分布式数据库管理系统统一管理。这是分布式数据库系统的逻辑整体性特点,也是与分散式数据库系统的最大区别。   (3)站点自治性。各站点上的数据由本地的分布式数据库管理系统管理,具有自治处理能力,完成本场地的应用(局部应用)。   (4)站点间协作性。各站点虽然具有高度的自治性,但是又相互合作构成一个整体。对全局用户来说,使用分布式数据库系统如同集中式数据库系统一样,用户可以在任何一个站点执行全局应用。   2.分布式数据库查询优化的目标与方案   2.1优化的目标   分布式查询系统的优化目标一般有两种:一是使网络数据传输量最小,一是使响应时间最短。与集中式的数据库系统相比,网络的传输速度与计算机内部的数据传输速度一般相差几个数量级,因此查询的局部处理时间与节点之间数据传输的时间相比,几乎可以忽略不计。而过多的网络传输可能会给网络造成比较大的负担。因此,减少网络数据传输量成为分布式查询处理的主要问题。因此,分布式查询处理常常以减少网络间传递的数据量作为优化目标。   2.2查询优化技术方案   分布式数据库研究的主要目标之一是隐藏分布式环境的细节,使系统用起来更加简单、有效。关系数据模型可以为集中式数据库提供一个数据无关的接口。关系数据库语言是关系演算,使用该语言进行数据查询时,只需对要查询的数据进行简单的描述,而无须说明如何获取这些数据,SQL语言就是其中之一。查询优化器的主要任务是控制和加快查询的执行和数据的传输过程。   查询优化器(如下图)首先以查询的某种表示作为输入,这种表示是查询处理器的语法分析子模块的输出,查询优   化器为查询选择一种适当的数据存取策略。      DBMS组成中对于用户所观察到的数据库性能影响最大的是查询处理器。查询处理器分为两个部分:查询编译器和执行引擎。   (1)查询编译器,它将查询翻译成一种内部形式,称作查询计划。查询计划是要在数据上执行的一系列操作。通常查询计划中的操作是“关系代数”的实现。   (2)执行引擎,它负责执行选中的查询计划中的每一步。执行引擎与DBMS中大多数的其他成分都有交互,或直接交互,或通过缓冲区间接交互。   3.分布式查询优化的技术实现   3.1 术语定义   全局优化:指分布式数据库系统中,根据各节点的资源状况和处理能力进行,从整体的角度进行的优化。

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档