数据结构与算法“索引”教学设计.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据结构与算法“索引”教学设计

数据结构与算法 “索引”教学设计 北京大学信息科学技术学院 张铭 1. 索引在课程中的定位和前测知识点 数据结构设计的重要目标之一是提高操作速度,对数据库而言,主要是检索速度。实际 上索引是为检索服务的,而排序又是为索引服务的。散列方法,其实是对关键码的索引,与 关键码对应的记录数据可能存放在其他地方;局部平衡的红黑树、平衡的AVL 树、自组织 的伸展树等二叉搜索树具有良好的检索性能,非常适合于基于内存的索引。 前测知试点要求如下,可以根据需要给学生补充: (1)索引、主码、辅码的基本概念; (2 )二分查找的概念; (3 )二叉搜索树的查找和插入操作。 2.学习目标 (1)理解几种重要的基于磁盘的索引文件组织方式; (2 )能比较各种索引技术的性能并进行简单的分析; (3 )掌握B/B+树动态索引技术; (4 )了解位图索引技术以及文本信息检索中的签名文件索引; (5 )了解高效率的常用二叉搜索树索引结构红黑树。 3. 知识点和学时分配 理论授课4 学时,建议安排实验10 学时。 以下内容是本课程要求的基本教学内容,在授课中必须完全涵盖,主讲教师可以根据学 生的状况、教师的科研背景等在某些方面进行扩展和对学生进行引导,以扩大适当学生的涉 猎面。对于非计算机类的学生,可以不讲红黑树部分。 各知识点建议授课时间如下: 索引技术的基本概念 0.1 小时 线性索引 0.1 小时 静态索引 0.3 小时 倒排索引 0.5 小时 动态索引 1 小时 位索引技术 0.5 小时 红黑树 1.5 小时 4.重点和难点 索引重点如下: (1)B/B+树的查找、插入、删除、访外次数分析; (2 )线性索引的基本概念及优缺点、二级线性索引; (3 )静态索引及多分树的基本概念; (4 )基于属性、正文文件的倒排索引的基本概念。 索引难点如下: (1)B/B+树的性能分析; (2 )红黑树的基本概念和插入、删除算法。 5.授课提示 开展研究型教学,挖掘知识背后的内容,通过提出问题、探讨方法、研究思想、比较性 能,培养学生的创新意识、创新能力。 下面是索引部分的重点和难点内容的讲授注意事项。 (1)B/B+树的查找、插入、删除、访外次数和性能分析 B/B+树是动态的索引结构,允许动态地插入或删除记录,索引结构本身也可能发生改 变。改变索引结构的目的是为保持较好的性能,例如较高的检索效率。 B+树是B 树的一种变形树,他们的区别如下:(1)B 树有k 个子结点的结点拥有k-1 个关键码;B 树有k 个子结点的结点必然有k 个关键码。(2 )B 树中关键码没有重复,父结 点中的关键码是其子结点的分界;B+树内部分支结点仅具有索引作用,可以看作是从叶往 根的方向一层层复写子结点中的最大(或最小)关键码。(3 )B+ 中叶结点是关键码的一个 全集,跟实际数据记录有关的信息均存放在叶结点中。B+树本身也有很多变体。 B 树、B+树的插入与删除都要特别注意保持其平衡性质,特别是等高、子结点个数、 关键码个数的上下界限制。由于B 树和B+树本身具有相似性,又略微不同,因此其它们的 操作过程类似,但是有一些差别。 学生容易不能理解B/B+树插入删除的具体过程,细节容易忽略,可以采用动画等直观 地进行演示,尤其是分裂合并的过程。 对B 树的查找和插入算法进行性能分析。通过公式演算让学生了解B 树性能分析的具 体计算过程。 (2 )线性索引的基本概念及优缺点、二级线性索引 线性索引被组织成简单的(关键码,指针)的序列,按照关键码的顺序进行排序,其常 用检索技术是二分检索。数据规模太大,索引文件无法完全存储到内存时,可以采用二级线 性索引。 (3 )静态索引及多分树的基本概念 多分树静态索引结构在文件创建、初始装入记录时生成,并固定不变,插入和删除操作

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档