第九章作业讲评.pptVIP

下载本文档

1
0
约2.41千字
约 10页
2018-04-29 发布于河南
举报
版权申诉

第九章作业讲评.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第九章作业讲评

第九章作业讲评 05计算机数据库系统概论总评本章的知识点比较多，需要充分理解才能灵活运用。 58人按时交作业。难点：代价估算。突出问题：对代价计算公式不理解；对文件、索引结构不清楚；对各种连接算法理解不透彻；优秀作业：孙妍、康菁菁、呼荣权题1 查询优化的重要性和可能性重要性减轻用户选择路径的负担，用户不必考虑如何表达查询以获得最好的效率可能性优化器从数据字典中获取统计信息如果物理统计信息改变，系统自动对查询进行重新优化优化器可以考虑多种不同的执行计划系统自动优化使得更多的使用者可以拥有优化技术题2 题3、4 RDBMS查询优化一般准则：包括代数优化P-271，物理优化P-273 RDBMS查询优化的一般步骤：把查询转换成某种内部表示把语法树转换成标准优化形式选择低层的存取路径生成查询计划，选择代价最小的补充题1 （1）折半扫描：（2）主索引上的等值选择：（3）主索引上的非等值选择：（4）辅助索引上的等值选择：（5）辅助索引上的非等值选择，以及索引查询与全表扫描的的比较： Dist(Sage,Student)=12,Min(Sage,Student)=18,Max(age,Student)=29 Sage=22 SF=(29-22+1)/12=2/3 （6）考查复杂选择查询方法：利用一个索引；标识符交集法；利用标识符交集法，代价为H1+H2+读结果元组所需I/O。估计约有209条元组满足要求，由于属性dept上有主索引，结果最少存放在209/25块内，最多存放在(10000/4)/25=100块内。因此，总代价为3+3+100=106。补充题2 考核要点：连接运算代价估计典型问题第二小问使用索引嵌套循环连接树的深度是4，c=4+1=5 代价为5*20000+1000=101000 第三小问使用排序归并连接，很多同学排序代价计算错误对R1排序代价：(2log2(1000/3)+1)*1000+1000=20000 对R2排序代价：(2log2(1500/3)+1)*1500+1500=30000 总代价：20000+30000+1000+1500=52500 第四小问使用散列连接，内存为50块 R1划分为20块，每个划分占50块，正好装入内存。 R2同样划分为20块，每个划分占75块总代价：3*(1000+1500)=7500块补充题3 考核要点：基于代价的优化，中间结果估算典型问题：有同学将Student(Sno, Sname, Sdept)和Course(Cno, Cname)做自然连接。两个表没有相同的属性，不能自然连接。选择条件可以合并，一次就可以检查全部条件，许多同学没有注意到这点。中间结果估算(元组数)： Student×SC×Course: 10000*15000*300 Student SC Course: 15000 （外码） δSdept=‘CS’(Student): 10000*(1/50) δCname=‘DB’(Course): 1 δGrade90(SC): 15000*((100-90)/(100-60)) 补充题4 对A、B属性上索引的叶子节点进行sort-merge join，结果为R元组的的地址和S元组地址。由于连接结果相对于原表元组数较少（50个元组），因此可以不对S地址进行排序，直接读取R和S的相应块。总代价为：180+50+50=280 典型错误每个叶子结点有200个指针（错误原因：应按最差情况叶结点半满计算）；总代价加上了索引高度（错误原因：B+树第一个叶子结点的地址能够直接获取）；索引高度计算错误（正确公式： ) 对S地址排序，计算排序I/O（错误原因：连接结果较小时排序不能减少代价，反而增加额外开销）；以R作为外表，扫描S表索引叶子结点（错误原因：没有充分利用题目条件，不符合sort-merge join的要求）；补充题5 考核要点：启发式优化方法典型问题：题目要求给出使用每一条优化规则后的查询树，很多同学没有写出具体步骤，只给出最后结果。许多同学将Departments( deptname, managerSSN, location)和Projects( projname, budget, status) 自然连接，这两个关系没有相同的属性，不能做自然连接。许多同学不知道PPT112页中Rule3如何应用。这题中有两种连接顺序:(Departments Participate) Projects和Department