网站大量收购独家精品文档,联系QQ:2885784924

分布式数据库查询优化算法研究-计算机软件与理论专业论文.docx

分布式数据库查询优化算法研究-计算机软件与理论专业论文.docx

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分布式数据库查询优化算法研究-计算机软件与理论专业论文

摘 摘 要 分布式数据库查询优化算法研究 分布式数据库查询优化算法研究 I I PAGE PAGE IV 摘 要 随着计算机网络和数据库技术的迅速发展,人们对数据库的要求越来越高。 传统的集中式数据库一般都被放置在服务器上,这样比较方便管理,但随着网络 技术的迅猛发展,数据分布存储和分布处理越来越重要,从分布于不同地理位置 的数据库系统中获取相关信息已成为必然趋势。为了满足这些需求,人们在成熟 的集中式数据库技术的基础上提出了分布式数据库。可以说,分布式数据库是数 据库技术和网络技术两者相互渗透和有机结合的产物。 集中式数据库系统尽量减少数据的冗余,但是分布式数据库系统却需要增加 数据的冗余来保证系统的可靠性,提高系统性能和效率。所以分布式数据库系统 和集中式数据库系统的实现机制是不同的,分布式数据库系统需要适当地增加数 据的冗余,这使得查询处理更加复杂。那么,在分布式数据库查询处理过程中, 对查询过程进行优化能够降低查询代价,提高查询效率,特别是在传输数据量很 大时,选择一个好的优化算法就显得尤为重要。 本文首先介绍了分布式数据库系统的基本概念,如分布式数据库系统的起源 与发展,分布式数据库系统的定义及特点,数据分片和数据分布的具体概念及原 则分类,分布式数据库系统的模式结构及体系结构等等。 其次简要地描述了分布式查询处理过程和常用的分布式数据库查询优化算 法,如基于关系代数等价变换规则的优化算法、基于直接连接操作的优化算法、 基于半连接操作的优化算法和SDD_1算法。 最后本文在研究上述分布式数据库查询优化算法的基础上,针对SDD_1算法 的不足之处(选择因子很难估算、需要进行多次辅助运算等等),提出了一种新 的查询优化算法,本文暂且命名为基于二次半连接的分布式数据库多元连接查询 优化算法。这种算法避免了SDD_1算法的不足, 采用了二次半连接技术,对两个 站点之间的联接进行了完全缩减,再结合最小生成树算法的思想,可以得到多元 连接查询优化的最小通信代价,以及在获得该代价时的各站点的装配情况和连接 先后顺序。根据算法实例结果的分析,该算法能够取得与SDD_1算法相似的查询 效率,而且运算量不大,在某些特定的情况下,完全可以代替SDD_1算法,取得 很好的查询优化效果。 关键词: 分布式数据库,查询优化,SDD_1 算法,二次半连接,多元连接查询 Abstract With the rapid development of computer network and database technique, the people’s requirement about database is increasing .The traditional centralized database is usually put on the server .So it is convenient to manage. But with the speedy development of network technique, the data distributed storage and distributed process are more and more important. It is the necessary trend to obtain the relational information from database systems that are distributed in different geography locations. To meet this demand, the people based on the mature technique of the centralized database put forward the distributed database. As a matter of fact, the distributed database is the mutual filtering and organic combined outcome of the database technique and network technology. The centralized database system makes the most of reducing the data redundancy, but the distributed database system needs to increase properly the data redundancy to assure the credibility of the system and improve the

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档