- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
哈希函数的构造方法
应用举例: 我们学校的电话号码: 8390001 8390002 8390003 8390004 * 构造哈希表时出现Ki≠Kj(i≠j),但h(Ki)=h(Kj)的现象称作哈希冲突。这种具有不同关键字而具有相同哈希地址的数据元素称作“同义词”,由同义词引起的冲突称作同义词冲突。 解决哈希冲突的基本思想是通过哈希冲突函数(设为hl(K)(l=1,2,…,m-1))产生一个新的哈希地址使hl(Ki)≠hl(Kj)。把要存储的n个数据元素通过哈希函数映射到了m个连续内存单元中,从而完成了哈希表的构造。 可见,构造哈希表时一定要使用主关键字,不能使用次关键字。 * 设定哈希函数 H(key) = key MOD 11 ( 表长=11 ) 19 01 23 14 55 68 若采用线性探测再散列处理冲突 11 82 36 1 1 2 1 3 6 2 5 1 例如: 关键字集合 { 19, 01, 23, 14, 55, 68, 11, 82, 36 } 8 1 1 3 0 2 0 5 3 平均查找长度=22/9=2.44 * 构造哈希表时 ,冲突是不可避免的,有关因素主要有如下三个: (1)装填因子。装填因子是指哈希表中已存入的数据元素个数n与哈希地址空间大小m的比值,即α=n/m,α越小,冲突的可能性就越小,但哈希表中空闲单元的比例就越大; α越大(最大可取1)时,冲突的可能性就越大,但哈希表中空闲单元的比例就越小,存储空间的利用率就越高。 (2)与所采用的哈希函数有关。 (3)与解决哈希冲突的哈希冲突函数有关。 * 8.5.2.哈希函数的构造方法 常用的哈希函数构造方法有: 1.除法取余(除留余数) 2.直接定址法 3.数字分析法 4.折叠法 5.平方取中 函数设计目标:使通过哈希函数得到的n个数据元素的哈希地址尽可能均匀地分布在m个连续内存单元上,同时使计算过程尽可能简单以达到尽可能高的时间效率。 * h(K) = K mod m 优点:计算简单,适用范围广 关键:选好哈希表长度m 技巧:哈希表长m取质数时效果最好,一般为一个4k+3的质数。 ①除法取余 例:设定哈希函数 H(key) = key MOD 11 ( 表长=11 ) 关键字集合: { 19, 01, 23, 14, 55, 68, 11, 82, 36 } 8 1 1 3 0 2 0 5 3 * ②直接定址法 h(K) = K + C 优点:计算简单,不会发生冲突 缺点:有可能造成内存单元的大量浪费 直接定址哈希函数之一 地址 0001 0002 0003 0004 0005 …… 电话 8390001 8390002 8390003 8390004 8390005 …… * ②直接定址法 h(K) = K + C 直接定址哈希函数之二 地址 01 02 03 04 05 …… 年龄 1 2 3 4 5 …… 人数 3000 2000 5000 3000 2600 例: 有一个从1岁到100岁的人口数统计表,其中,年龄作为关键字,哈希函数是关键字自身。 * 特点:取数据元素关键字中某些取值较均匀的数字位作为 哈希地址,只适合于所有关键字值已知的情况。 ③数字分析法 8 1 3 4 6 5 3 2 8 1 3 7 2 2 4 2 8 1 3 8 7 4 2 2 8 1 3 0 1 3 6 7 8 1 3 2 2 8 1 7 8 1 3 3 8 9 6 7 8 1 3 5 4 1 5 7 8 1 4 6 8 5 3 5 例:有80个记录,关键字为8位10进制数。假设哈希表的表长为100,则可取两位十进制数构成哈希地址。取哪两位呢? * ④折叠法 将关键字分割成若干部分,然后取它们的叠加和(舍去进位)为哈希地址。有两种叠加处理的方法:移位叠加和间界叠加。 例:关键字是图书的ISBN号,其特点为:由10位数字构成。当馆藏图书不足10000时。可采用折叠法构造一个4位的哈希函数。 ISBN号:04-4220-5864 H(key)=0088 H(key)=6092 移位叠加
原创力文档


文档评论(0)