哈希的基本概念.pdf

下载文档 降价啦

5
0
约4.41千字
约 6页
2020-10-27 发布于江苏
举报
版权申诉
保障服务

哈希的基本概念.pdf

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

6.8 哈希表及其查找★3◎4 　　哈希译自 “hash ”一词，也称为散列或杂凑。　　哈希表查找的基本思想是：根据当前待查找数据的特征，以记录关键字为自变量，设计一个哈希函数，依该函数按关键码计算元素的存储位置，并按此存放；查找时，由同一个函数对给定值 key 计算地址，将 key 与地址单元中元素关键码进行比较，确定查找是否成功。哈希方法中使用的转换函数称为哈希函数（杂凑函数），按这个思想构造的表称为哈希表（杂凑表）。　　对于 n 个数据元素的集合，总能找到关键码与存放地址一一对应的函数。若最大关键为 m ，可以分配m 个数据元素存放单元，选取函数 f(key)=key 即可，但这样会造成存储空间的很大浪费，甚至不可能分配这么大的存储空间。通常关键码的集合比哈希地址集合大得多，因而经过哈希函数变换后，可能将不同的关键码映射到同一个哈希地址上，这种现象称为冲突（Collision ）。映射到同一哈希地址上的关键码称为同义词。可以说，冲突不可能避免，只能尽可能减少。所以，哈希方法需要解决以下两个问题：　　（1）构造好的哈希函数　　① 所选函数尽可能简单，以便提高转换速度。　　② 所选函数对关键码计算出的地址，应在哈希地址集中大致均匀分布，以减少空间浪费。　　（2 ）制定解决冲突的方案　　1．常用的哈希函数　　（1）直接定址法　　即取关键码的某个线性函数值为哈希地址，这类函数是一一对应函数，不会产生冲突，但要求地址集合与关键码集合大小相同，因此，对于较大的关键码集合不适用。如关键码集合为{100，300，500，700 ，800，900}，选取哈希函数为 Hash(key)=key/100 ，则存放如表6-3所示。表6-3 直接定址法构造哈希表地址 0 1 2 3 4 5 6 7 8 9 关键码 100 300 500 700 800 900 　　（2 ）除留余数法　　即取关键码除以 p 的余数作为哈希地址。使用除留余数法，选取合适的p 很重要，若哈希表表长为 m ，则要求p ≤m ，且接近m 或等于 m 。p 一般选取质数，也可以是不包含小于20质因子的合数。　　（3 ）数字分析法　　设关键码集合中，每个关键码均由 m 位组成，每位上可能有 r 种不同的符号。　　数字分析法根据 r 种不同的符号及在各位上的分布情况，选取某几位，组合成哈希地址。所选的位应是各种符号在该位上出现的频率大致相同。　　（4 ）平方取中法　　对关键码平方后，按哈希表大小，取中间的若干位作为哈希地址。　　（5 ）折叠法（Folding ）　　此方法将关键码自左到右分成位数相等的几部分，最后一部分位数可以短些，然后将这几部分叠加求和，并按哈希表表长，取后几位作为哈希地址。这种方法称为折叠法。　　有两种叠加方法：　　① 移位法——将各部分的最后一位对齐相加。　　② 间界叠加法——从一端向另一端沿各部分分界来回折叠后，最后一位对齐相加。　　如对关键码为 key=25346358705 ，设哈希表长为3位数，则可对关键码每3位一部分来分割。关键码分割为如下4组： 253 463 587 05　　分别用上述方法计算哈希地址如图6-12所示。对于位数很多的关键码，且每一位上符号分布较均匀时，可采用此方法求得哈希地址。　　2 ．处理冲突的方法　　（1）开放定址法　　所谓开放定址法，即由关键码得到的哈希地址一旦产生了冲突，也就是说，该地址已经存放了数据元素。我们需要寻找下一个空的哈希地址，只要哈希表足够大，空的哈希地址总能找到，并将数据元素存入。常用的找空哈希地址方法有下列三种。　　① 线性探测法　　其中，Hash(key)为哈希函数，m 为哈希表长度，为增量序列1，2 ，…， m-1 ，且 = i 。　　设关键码集为 {47 ，7 ，29 ，11，16，92，22 ，8，3}，哈希表表长为11， Hash(key)=key mod 11 ，用线性探测法处理冲突，构造哈希表如表6-4所示。表6-4 哈希表 0 1 2 3 4 5 6 7 8