第九章作业讲评.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九章作业讲评

第九章作业讲评 05计算机 数据库系统概论 总评 本章的知识点比较多,需要充分理解才能灵活运用。 58人按时交作业。 难点:代价估算。 突出问题: 对代价计算公式不理解; 对文件、索引结构不清楚; 对各种连接算法理解不透彻; 优秀作业:孙妍、康菁菁、呼荣权 题1 查询优化的重要性和可能性 重要性 减轻用户选择路径的负担,用户不必考虑如何表达查询以获得最好的效率 可能性 优化器从数据字典中获取统计信息 如果物理统计信息改变,系统自动对查询进行重新优化 优化器可以考虑多种不同的执行计划 系统自动优化使得更多的使用者可以拥有优化技术 题2 题3、4 RDBMS查询优化一般准则: 包括代数优化P-271,物理优化P-273 RDBMS查询优化的一般步骤: 把查询转换成某种内部表示 把语法树转换成标准优化形式 选择低层的存取路径 生成查询计划,选择代价最小的 补充题1 (1)折半扫描: (2)主索引上的等值选择: (3)主索引上的非等值选择: (4)辅助索引上的等值选择: (5)辅助索引上的非等值选择,以及索引查询与全表扫描的的比较: Dist(Sage,Student)=12,Min(Sage,Student)=18,Max(age,Student)=29 Sage=22 SF=(29-22+1)/12=2/3 (6)考查复杂选择查询方法:利用一个索引;标识符交集法; 利用标识符交集法,代价为H1+H2+读结果元组所需I/O。估计约有209条元组满足要求,由于属性dept上有主索引,结果最少存放在209/25块内,最多存放在(10000/4)/25=100块内。因此,总代价为3+3+100=106。 补充题2 考核要点:连接运算代价估计 典型问题 第二小问使用索引嵌套循环连接 树的深度是4,c=4+1=5 代价为5*20000+1000=101000 第三小问使用排序归并连接,很多同学排序代价计算错误 对R1排序代价:(2log2(1000/3)+1)*1000+1000=20000 对R2排序代价:(2log2(1500/3)+1)*1500+1500=30000 总代价:20000+30000+1000+1500=52500 第四小问使用散列连接,内存为50块 R1划分为20块,每个划分占50块,正好装入内存。 R2同样划分为20块,每个划分占75块 总代价:3*(1000+1500)=7500块 补充题3 考核要点:基于代价的优化,中间结果估算 典型问题: 有同学将Student(Sno, Sname, Sdept)和Course(Cno, Cname)做自然连接。两个表没有相同的属性,不能自然连接。 选择条件可以合并,一次就可以检查全部条件,许多同学没有注意到这点。 中间结果估算(元组数): Student×SC×Course: 10000*15000*300 Student SC Course: 15000 (外码) δSdept=‘CS’(Student): 10000*(1/50) δCname=‘DB’(Course): 1 δGrade90(SC): 15000*((100-90)/(100-60)) 补充题4 对A、B属性上索引的叶子节点进行sort-merge join,结果为R元组的的地址和S元组地址。由于连接结果相对于原表元组数较少(50个元组),因此可以不对S地址进行排序,直接读取R和S的相应块。 总代价为:180+50+50=280 典型错误 每个叶子结点有200个指针(错误原因:应按最差情况叶结点半满计算); 总代价加上了索引高度(错误原因:B+树第一个叶子结点的地址能够直接获取); 索引高度计算错误(正确公式: ) 对S地址排序,计算排序I/O(错误原因:连接结果较小时排序不能减少代价,反而增加额外开销); 以R作为外表,扫描S表索引叶子结点(错误原因:没有充分利用题目条件,不符合sort-merge join的要求); 补充题5 考核要点:启发式优化方法 典型问题: 题目要求给出使用每一条优化规则后的查询树,很多同学没有写出具体步骤,只给出最后结果。 许多同学将Departments( deptname, managerSSN, location)和Projects( projname, budget, status) 自然连接,这两个关系没有相同的属性,不能做自然连接。 许多同学不知道PPT112页中Rule3如何应用。这题中有两种连接顺序:(Departments Participate) Projects和Department

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档