基于并行遗传最大最小蚁群算法分布式数据库查询优化.docVIP

  • 29
  • 0
  • 约5.59千字
  • 约 9页
  • 2018-08-29 发布于福建
  • 举报

基于并行遗传最大最小蚁群算法分布式数据库查询优化.doc

基于并行遗传最大最小蚁群算法分布式数据库查询优化

基于并行遗传最大最小蚁群算法分布式数据库查询优化   摘要:针对分布式数据库中关系及其分片多副本、多站点存储的特性会增加查询搜索空间及时间复杂度,从而降低查询执行计划(QEP)搜索效率的问题,提出一种基于分片分配选择器(FSS)设计准则的并行遗传最大最小蚁群算法(PGAMMAS)。首先,结合实际的企业分布式信息管理系统设计FSS,启发式选择较优关系副本,以减少查询连接代价并缩小PGAMMAS的搜索空间;然后结合遗传算法(GA)收敛较快的优势,对最终连接关系进行编码和并行遗传操作,得到一组相对较优的QEP,并将其转化为并行最大最小蚁群算法(MMAS)的初始信息素分布,从而使其更快速地搜索到全局最优QEP;最后分别在不同关系数情况下对算法进行仿真实验,结果表明,基于FSS的PGAMMAS搜索最优QEP的效率高于原GA以及基于FFS的GA、MMAS和GAMMAS;经实际工程应用验证,所提算法搜索出的高质量QEP可以提高分布式数据库多关系查询效率。   关键词:分布式数据库;遗传算法;最大最小蚁群算法;最优查询执行计划;并行   中图分类号: TP311.13 文献标志码:A   0引言   随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩大,以分布式为主要特征的数据库系统的研究与开发受到人们的高度关注。而数据存储量的暴增以及查询要求的复杂化,使得如何提高分布式数据库的查询速度成为研究热点。多关系连接查询作为数据库中最基本最常用的操作,是查询优化中需要突破的一个难点。多关系连接查询化旨在寻求最优的查询执行策略,快速、高效地将查询结果反馈给用户。而分布式数据库的分布性和冗余性,要求在生成最优查询执行计划(Query Execution Plan, QEP)时需要综合考虑网络模型、数据分布和传输代价等因素的影响[1]。事实上,一个查询策略的选择对于包含多个关系的复杂查询而言是一个NP问题,因此在优化中经常需要依赖于对处理环境进行的简单假设,选择一个接近于最优的执行策略。   目前已有许多算法被提出应用于解决分布式数据库查询优化问题。文献[2]提出了动态规划算法,作为一种近似穷尽式的搜索算法,但当关系数大于8时,其计算量非常大。文献[3]中使用的迭代改进算法和模拟退火算法是两种随机搜索算法,与动态规划算法相比,这两种算法虽然减少了搜索代价,但不保证能够得到最优解。文献[4-5]作者提出了基于遗传算法(Genetic Algorithm,GA)生成分布式QEP的方法,文献[6]利用蚁群算法(Ant Colony Algorithm, ACA)解决这一问题。但上述文献中并没有考虑分布式数据库中关系及其分片的分布性和冗余性使查询复杂化的问题。此外,本文考虑将遗传算法和蚁群算法结合[7-8]起来解决分布式数据库查询优化问题。   本文在自主设计的分片分配选择器(Fragmentation Site Selector, FSS)基础上,提出一种将遗传算法和最大最小蚁群算法(MaxMin Ant System, MMAS)相结合的查询优化方法。首先用FSS解决分布式数据库查询中关系分片及操作站点选择问题,然后利用GA快速收敛的特性寻求一组较优的QEP,转化成MMAS的初期信息素,指引蚁群利用MMAS更好的全局收敛性更快找到最优的QEP,并对整体求解过程并行化处理,进一步提高求解速度。实验表明改进的并行遗传最大最小蚁群算法(Parallel Genetic AlgorithmMaxMin Ant System, PGAMMAS)的求解速度比MMAS快,且得到的解优于GA,时间效率和求解精度都较优。   5结语   本文针对当前分布式数据库查询优化算法存在的效率低、难以获得最优执行计划的缺陷,提出了一种基于分片分配选择器的PGAMMAS优化算法。实验结果表明,通过FSS选择较优的关系分片进行连接,可以降低连接代价、缩减PGAMMAS搜索空间并降低其编码复杂度。在FSS的基础上,本文提出的PGAMMAS通过两种基本算法的融合,优势互补,GA弥补MMAS初期信息素不足造成的收敛较慢的缺点,而后期用MMAS可以解决GA较容易陷入早熟状态的问题,同时利用算法本身的并行性及分布式数据库的集群环境使其并行化,进一步加速算法收敛。为探究算法的性能,对不同关系数的查询进行了多组实验,实验结果表明,PGAMMAS相对于其他算法有更高的运行速度和更好的求解能力。   参考文献:   [1]   HAMEURLAIN A, MORVAN F. Evolution of query optimization methods [C]// HAMEURLAIN A, KNG J, WAGNER R. Transactions on Lar

文档评论(0)

1亿VIP精品文档

相关文档