- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《第七章访问策略的优化
第七章 访问策略的优化
在第六章中,我们已经讨论了对于全局关系的查询算符树,如何依据准则1---2通过关系代数的等价变换来改良查询;对于规范化算符树则再依据准则3---5通过限定关系代数的等价变换来改良查询;这种改良可提高访问效率,但没有进行量化的讨论,如提高效率多少?减少开销多少?
本章讨论内容已由标题醒目的点出:访问策略的优化,特点是基于数据库值的优化,有具体的量化,比较深入。即在各种可能的方案中选择一种费用最少的方案,相对而言,效率也较高,但往往得不到最忧方案,只是找一个较好的方案。
7.1 查询优化概论
本节首先讨论查询处理问题、模型化问题和解决这些问题所需的假定,以及优化中使用的准则,然后建立查询的新模型及相应的定量参数。
7.1.1 查询优化中的问题
查询处理策略的选择包括:
1.对某一段,给定一个查询表达式,决定要对这个段执行查询的物理拷贝,一般在文献中使用实质这个术语来表示对其执行查询的一个非冗余的拷贝,实质相当于为每个段选择它的一个拷贝。不同的查询可能使用不同的实质。
2.选择操作执行的次序。即如何决定结合、半结合和并集操作这几种混合操作的次序。第六章查询变换以后产生的算符树隐含地定义了操作的部分次序,即从叶至根向上的执行操作,但这并没有完全规定优化问题的解,还要指出树的同一级上执行的各子表达式求值的次序,同时,从叶至根地向上执行并不一定能产生最佳结果。
3. 选择执行每个操作的方法。包括在同一数据库访问中选择一起执行几个代数操作(如同时对同一操作执行选择和投影操作),以及在各种可用的方法中选择执行每个数据库访问的方法。最困难的是决定结合求值的最佳方案。
上述三个问题相互间有影响,并非孤立。但也相当复杂,这里假设三者独立,并重点讨论第二个问题。
7.1.2 查询处理优化的目标
不管在集中式还是分布式环境中,查询执行策略都是根据对各种方案的期望性能进行衡量来选择的。
在集中式数据库中,典型的度量方法是计算输入/输出操作的次数以及CPU的使用情况(I/O 次数要尽量少、CPU占用尽量少)。
在分布式数据库中,除上述两项外,还必须考虑数据的传输量及延迟。
时间,针对考虑的方面不同,主要目标也不同。
传输的要求可以依据费用和延迟这两方面来评价。
1.当考虑费用时,一个应用的性能是用所有传输的费用之和来度量的。
2.当考虑效率时,一个应用的性能是用此应用从激活到完成所经历的时间来度量的。
一次传输的传输费用TC和传输延迟TD可用函数表示为:
TC(X) = C0 + X × C1
TD(X) = D0 + X × D1
其中C0、D0、C1、D1是与系统有关的常数,C0相当于在两站点间启动一次传输所需的固定费用;C1是网络范围内统一的单位数据传输费用;D0是建立一个连接所需的固定时间,D1是网络范围内统一的传输单位信息的时间。
如果全网各站点可能不均,考虑费用和延迟的更为详细的特性,即每对站点具有不同的系数,一次传输的传输费用TC和传输延迟TD可用函数表示为:
TC(X) = C0ij+ X × C1ij
TD(X) = D0 ij+ X × D1ij
其中两个上标 I 和 j 分别表示这次传输的源和宿。这里假设是匀质。
7.1.3 一种新的查询模型
7.1.3.1 数据库的概貌
对于段Ri ,其概貌其可由下列信息组成:
1.每个段Ri 的元组数目----基数,表示为 Card(A);
2.每个属性A的大小(即字节数),表示为 Size(A);一个段的大小,表示为Size(Ri),等于其属性大小之和,即Ri的记录长度。
3. 对于每个段Ri中的每个属性A,在Ri中出现的不同的值的数目,表示为Val(A[Ri])。
对于全局关系的概貌也同样由这三种信息组成。
例如:
Card(SUPPLY) = 50000
SNUM PNUM DEPTNUM QUAN
Size 6 7 2 10
Val 3000 1000 30 500
Card(DEPT) = 30
DEPTNUM NAME AREA MGRNUM
Size 2 15 1 7
Val 30 30
文档评论(0)