- 2
- 0
- 约8.23千字
- 约 58页
- 2017-07-08 发布于湖北
- 举报
第五章 分布查询的存取优化 上一章内容回顾: 1 为什么要进行查询优化? 2 查询优化主要考虑哪些因素? 3 全局优化的一般规则包括哪些?为什么采用这些规则? 4 查询树的组成? 5 片段查询优化的规则包括哪些?为什么建立用这些规则? 主要内容 基本概念 存取优化的理论基础 半联接优化方法 SDD-1 系统优化技术 枚举法优化技术 §5.1 基本概念 1、分布执行过程-1 分布执行过程实际上就是从查询场地发出查询命令、从数据源获取数据、确定最佳的执行场地和返回执行结果的过程。 §5.1 基本概念 §5.1 基本概念 1、分布执行过程-3 查询场地:指发出查询命令和存储最终查询结果的场地。查询场地也称最终结果文件。 源数据场地:指查询命令需要访问的数据副本所在的场地,可能涉及到一个或一个以上的场地。源数据场地也称源数据文件。 执行场地:指查询操作执行所在的场地。执行场地可以和查询场地或源数据场地处于同一场地,也可不处于同一场地。执行场地也称中间结果文件。 §5.1 基本概念 2、分布执行策略举例-1 例5.1.1 有关系EMP和DEPT。 EMP {ENO,ENAME,BIRTH,SALARY,DNO} (主键)雇员编号 雇员姓名 出生日期 工资 部门号 DEPT{DNO,DNAME} (主键)部门号 部门名称 假设: (1)EMP:元组数:10000,元组大小:100B,关系大小:100*10000=1000KB (2)DEPT:元组数:100,元组大小:35B,关系大小:35*100=3.5KB §5.1 基本概念 (1)?策略(设结果为R,以传输代价为主) 策略1:S3为执行场地,则需传输EMP、DEPT 传输量=1000K+3.5K=1003.5K 策略2:S2为执行场地,则需传输EMP到S2,结果R传 输到S3。传输量=1000K+400K=1400K 策略3:S1为执行场地,则需传输DEPT到S1,结果R传输到S3。 传输量=3.5K +400K=403.5K 从上面三个策略看,选择不同的执行场地,传输代价差别很大。应选择最低的传输代价。但组成系统的环境不同,优化的侧重点也不同。 §5.1 基本概念3、存取优化 存取优化的目标 (1)对于远程网,主要考虑通信开销,使通信代价最小。 (2)对于局域网,需同时考虑通信代价和本地处理代价,使综合代价最小。 存取优化的内容 存取优化是在全局优化后的片段查询的基础上进行的实际物理副本查询操作的优化。具体如下: 输入:片段查询表达式 输出:分布执行计划 §5.1 基本概念3、存取优化 内容: (1)确定片段查询需访问的物理副本。通常:①本场地上的物理副本优先;②若二元运算存在尽量选择本场地上的二元运算;③数据最小的物理关系应被优先选中;④网络通信代价小的应优先选中 (2)确定片段查询表达式操作执行的最优顺序。包括从叶到根的执行和同一层叶子上表达式执行的先后,特别是对查询树上的并操作和联接操作的执行次序的确定,其代价差别很大。 (3)选择执行每个操作的方法。如:尽量将同一场地上的、同一物理副本的全部操作组合在一起统一考虑完成。 §5.2 存取优化的理论基础 1、 代价模型 主要指传输代价、I/O代价和CPU代价。 传输代价 在传输过程中,有两种影响:费用和延迟。其中费用起决定作用。按传输费用衡量是指使通信中的整个传输开销最小,即传输的数据量最小。 模型为:CCOM(X)=C0+C1*X 其中:C0:场地间传输数据的启动所需的固定费用(启动一次),简称启动代价; C1:网络单位传输数据费用,简称单位传输代价; X:需传输的数据量。 §5.2 存取优化的理论基础 I/O代价 模型为:CIO(X)=[X/P]*CIO 其中:P:页面的大小;CIO:为每页平均访问代价; X:数据量大小。 CPU代价 模型:CCPU(X)=X*CCPU 其中:CCPU:单位指令代价;X:为指令数。 通常具有下面的统计值: 广域网环境:CCOM/ CIO=20:1; 局域网环境:CCOM/ CIO=1.6:1。 可见,在广域网环境,以传输代价为主;在局域网环境,需综合考虑传输代价和局部代价。 1、 查询模型 (1)数据库特征参数 假设R为一关系。 关系的序数:指关系R包含的元组个数,记为Card(R)。 属性的长度:指属性A定义的取值字节数,记为Length(A)。 元组的长度:关系R中每个元组的字节数,记为Length(R),Length(R)=∑Length(Ai) 关系的大小:关系R所包含的字节
您可能关注的文档
- 第十大题 方案经济比选讲述.doc
- 操作系统考试题和答案.doc
- 第一章 办公软件应用试卷1(附答案).docx
- 华为路由器 配置ARP教案.pdf
- 通过telnet 访问路由器剖析.doc
- 第十三章 电子邮件营销.pdf
- 第十一章 【Q语言】开发手册.pdf
- 计算机系统概论第二篇.doc
- 如何使用Fdisk命令格式化硬盘 及DM全解.doc
- 第一章 办公室管理笔记7.doc
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
原创力文档

文档评论(0)