- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数 据 结 构 Data Structure 主讲人: 刘 玮 第九章 查 找 9.1 查找的基本概念 9.2 线性表的查找 9.3 树表的查找 9.4 哈希表查找 本章小结 理解查找的基本概念,包括静态查找表和动态查找表; 重点掌握线性表上各种查找算法,包括顺序查找、二分查找和分块查找的基本思路、算法实现和查找效率等。 掌握各种树表的查找算法,包括二叉排序树、AVL树和B-树的基本思路、算法实现和查找效率等。 掌握哈希表的概念以及哈希表的构造方法。 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 线性表举例 (5)所有叶子结点包含全部(数据文件中记录)关键字及指向相应记录的指针(或存放数据文件分块后每块的最大关键字及指向该块的指针),而且叶子结点按关键字大小顺序链接(可以把每个叶子结点看成时一个基本索引块,它的指针不再指向另一级索引块,而是直接指向数据文件中的记录); (6)所有分支结点(可看成是索引的索引)中仅包含它的各个子结点(即下级索引的索引块)中最大关键字及指向子结点的指针。 B-树和B+树的差别: m阶的B+树和m阶的B-树,定义前三点是相同的,其差别是: (1)在B+树中,具有n个关键字的结点含有n棵子树,即每个关键字对应一棵子树,而在B-树中,具有n个关键字的结点含有(n+1)棵子树; (2)在B+树中,每个结点(除根结点外)中的关键字个数n的取值范围是 ,根结点n的取值范围是 ;而在B-树中,它们的取值范围分别是 和 ; (3)B+树中的所有叶子结点包含了全部关键字,即其他非叶子结点中的关键字包含在叶子结点中;而在B-树中,叶子结点包含的关键字与其他结点包含的关键字是不重复的; (4) B+树中所有非叶子结点仅起到索引的作用,即结点中的每个索引项只含有对应子树的最大关键字和指向该子树的指针,不含有该关键字对应记录的存储地址。而在B-树中,每个关键字对应一个记录的存储地址; (5)通常在B+树上有两个头指针,一个指向根结点,另一个指向关键字最小的叶子结点,所有叶子结点链接成一个不定长的线性链表。 哈希表(Hash Table)又称散列表,是除顺序表存储结构、链接表存储结构和索引表存储结构之外的又一种存储线性表的存储结构。哈希表存储的基本思路是:设要存储的对象个数为n,设置一个长度为m(m≥n)的连续内存单元,以线性表中每个对象的关键字ki(0≤i≤n-1)为自变量,通过一个称为哈希函数的函数h(ki),把ki映射为内存单元的地址(或称下标)h(ki),并把该对象存储在这个内存单元中。h(ki)也称为哈希地址(又称散列地址)。把如此构造的线性表存储结构称为哈希表。 9.4.1 哈希表的基本概念 但是存在这样的问题,对于两个关键字ki和kj (i≠j),有ki≠ kj,但是h(ki)=h(kj)。这种现象叫做哈希冲突。 通常把这种具有不同关键字而具有相同哈希地址的对象称作“同义词”,由同义词引起的冲突称作同义词冲突。在哈希表存储 结构的存储中,同义词冲突时很难避免的,除非关键字的变化区间小于等于哈希地址的变化区间,而这种情况当关键字取值不连续时是非常浪费存储空间的。通常的实际情况是关键字的取值区间远对于哈希地址的变化区间。 归纳起来: (1)哈希函数是一个映像,即将关键字的集合映射到某个地址集合上,它的设置很灵活,只要这个地址集合的大小不超出允许范围即可; (2)由于哈希函数是一个压缩映像,因此一般情况下很容易产生“冲突”现象,即key1≠key2,而f(key1)=f(key2); (3)很难找到一个不产生冲突的哈希函数。一般情况下,只能选择恰当的哈希函数,使冲突尽可能少的发生。 构造哈希函数的目标是使得到的哈希地址尽可能均匀地分布在n个连续内存单元地址上,同时使计算过程尽可能简单以达到尽可能高的时间效率。 9.4.2 哈希函数的构造方法 1.直接定址法 直接定址法是以关键字k本身或关键字加上某个数值常数c作为哈希地址的方法。直接定址法的哈希函数h(k)为: 这种哈希函数计算简单,并且不可能有冲突发生。当关键字的分布基本连续时,可用直接定址法的哈希函数;否则,若关键字分布不连续将造成内存单元的大量浪费。 2.除留余数法 除留余数法是用关键字k除以某个不大于哈希
文档评论(0)