- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
遗传规划在科学数据库查询优化中应用的初探
周园春 阎保平
(中国科学院计算机网络信息中心,北京100080)
摘要随着科学数据库中的数据量越来越大,对科学数据库的查询优化也就显得
越来越重要。本文对遗传规划在科学数据库查询优化中的应用作了初步的探讨。
关键词遗传规划科学数据库查询优化
1.引 言
科学数据库经过十几年的建设和发展,已经成为目前国内信息量最大,学科专业最广,
服务层次最高,综合性最强的科学信息服务系统。其内容涵盖了化学、生物、天文、材料、
腐蚀、光学机械、自然资源、能源、生态环境、湖泊、湿地、冰川、大气、古气候、动物、
水生生物、遥感等多种学科,截止2003年底,科学数据库专业数据库超过300个,总数据量
达4TB以上。科学数据库为科研工作者提供了一个良好的基础设施,已经成为科研工作者管
理信息和发掘信息的基本的工具。
但是随着时间的推移,科学数据库中的数据日益增加,查询科学数据库的效率就会影响
到科学数据库的使用,所以就有必要对科学数据库的查询进行优化。目前已经有很多算法应
用于数据库的查询优化。本文根据科学数据库查询优化的特点(本质上是查询树空间的搜索
问题)和遗传规划GP(Genetic
询优化中。
2.科学数据库中查询处理和优化的基本概念
2.1科学数据库中的查询处理
图1是科学数据库中的查询处理流程图,主要包括三个过程:查询语句解析器、查询优
化器和查询计划执行器,涉及到三种形式:查询语句、内部定义形式(查询树)、查询结果,
需要系统提供的支持:科学数据库目录(元数据)。
1.查询计划就是指查询是如何执行的,大部分的查询计划都是一个用树形结构,其叶节
点为关系表,中间节点为关系表的操作。
2.查询解析器主要是对查询语句进行语法分析,重写查询语句,并翻译成内部的表达形
式——查询树,以便更好的实现查询优化。
3.查询优化器主要的功能是由查询计划生成器枚举出多种等价于该内部表示形式的可能
方案,然后由查询计划评估器根据一定的评估模型对上述产生的每种方案进行评估,最后选
出选择执行最快的查询计划。
4.查询计划执行器就是执行选择好的查询计划,并返回查询的结果。在科学数据库中,
model),把查询执行分成好几个小操作,提供每个小
查询的执行可以利用地迭代模式(Iterator
操作的基本实现,每个小操作就是一个迭代子,这样充分利用流水线已达到更好的性能。
5.科学数据库目录主要是提供解析查询语句和优化、执行一个查询计划所需要的信息。
其中查询优化器是最关键的部分之一。
查询语句
’
查询树
k.-一
●
查询执行计划
}●■l·-一
, 一-[二!亟墅亟[]/
查询结果
图I科学数据库中的查询处理流程图
2.2科学数据库中的查询优化
在科学数据库中查询优化器的目的是对于任意给定的查询,寻找一个好的查询计划。典
型地,一个优化器只会考虑所有可能查询计划的一个子集,因为所有可能查询计划的数量会
非常巨大,如果一次考虑每个查询计划,从而执行其中最优的一个,会比只考虑一个查询计
划并直接执行它(即使它是个根本没有优化过的查询计划)而花费更多的时间。
科学数据库查询优化器主要通过三个步骤来实现的:第一,查询语句必须重写成查询树;
其次,优化器必须枚举出多种该表达式可能的查询计划;最后,优化器必须测算每个枚举的
计划的代价,从中选出最优(或者接近最优)的查询计划。
从科学数据库查询优化器的目的可以看出,它本质上是一个执行复杂搜索的问题,这就
意味着对于任意给出的查询,在语义等价的查询计划集中搜索一个最佳(有时候可能是次佳)
的计划。所以很多复杂搜索的方法都可以用于科学数据库的查询优化:
Search):它对整个搜索空间的每个查询计划进行评价.(有时会用
1.穷举搜索(Exhaust
您可能关注的文档
- COM技术应用于单机数据库向Internet迁移.pdf
- DInSAR技术在长时间地面沉降中的应用研究.pdf
- ETM影像湿地遥感信息提取的最佳波段选择——以扎陵湖、鄂陵湖地区为例.pdf
- GCC化学剂驱油作用机理实验研究.pdf
- GIS技术在上海数字港城建设中的应用.pdf
- H5和H7亚型禽流感多重RTPCR快速鉴别诊断方法的建立.pdf
- HSV LAT及其在潜伏感染中的作用.pdf
- IMUDGPS辅助数字航空摄影技术及其应用.pdf
- Internet上的中国冰冻圈数据库.pdf
- IT行业软件项目风险管理.pdf
- 以创新为主线的技术、经济与管理集成优化模式——国家九五技术改造优秀项目华新水泥股份有限公司节能环保技改工程的成功实践.pdf
- 隐蔽油气藏勘探技术在温米地区的应用及效果分析.pdf
- 莺歌海盆地圈闭分布的互补性特征分析.pdf
- 应用ActiveX技术实现WWW方式计算及绘图.pdf
- 应用N末端B型钠尿肽原对充血性心力衰竭患者进行预后及危险分层价值的评估.pdf
- 应用Oracle Web Server开发Web数据库.pdf
- 应用RTPCR和病毒学方法诊断山东省鸡新城疫感染的比较研究.pdf
- 应用软件服务器在图书馆数字化资源利用中的应用.pdf
- 应用北京一号小卫星数据进行长城普查的实验研究.pdf
- 应用一注多采技术改善超稠油油藏吞吐中后期开发效果.pdf
文档评论(0)