HashMap实现原理选读.docVIP

下载本文档

1
0
约2.62万字
约 21页
2017-09-03 发布于湖北
举报
版权申诉

HashMap实现原理选读.doc

1、本文档共21页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

HashMap实现原理分析概述 HashMap是Java集合框架（Java Collection Framework， JCF）中一个基础类，它在1998年12月，加入到Java 2版本中。在此之后，Map接口本身除了在Java 5中引入了泛型以外，再没有发生过明显变化。然而HashMap的实现，则为了提升性能，不断地在改变。 1.hash表的复习在正式学习HashMap源码之前，先复习一下hash表的实现。 1.1 什么是哈希表哈希表（Hash table，也叫散列表），是根据关键字值（key,value）直接进行访问的数据结构。也就是说，它通过把关键字映射到表中一个位置来访问的纪录，以加快查找的速度。这个映射函数叫做散列函数，存放纪录的数组叫散列表。 1.2 哈希函数 1.2.1 直接定址法取关键字或关键字的某个线性函数值为哈希地址。 H(key) = key 或 H(key) = a*key+b 1 1 1.2.2 除法散列法取关键字被某个不大于散列表表长m的数p除后所得的余数为散列地址。对p的选择很重要，一般取素数或m，若p选的不好，容易产生同义词. H(key) = key % p （p=m） 1 1 1.2.3 平方散列法当无法确定关键字中哪几位分布较均匀时，可以先求出关键字的平方值，然后按需要取平方值的中间几位作为哈希地址。这是因为：平方后中间几位和关键字中每一位都相关，故不同关键字会以较高的概率产生不同的哈希地址。 H(key) = ((key * Key) X) Y 1 1 1.2.4 fibonacci散列法和平方散列法类似，此种方法使用斐波那契数列的值作为乘数而不是自己。对于16位整数而言，这个乘数是40503。对于32位整数而言，这个乘数是2654435769。对于64位整数而言，这个乘数是11400714819323198485。 H(key) = ((key * 2654435769) X) Y 1 1 1.3 冲突解决 1.3.1 开放寻址法开放寻址法把所有的元素都存放在散列表中，也就是每个表项包含动态集合的一个元素（元素可以为NULL）。 1.在开放寻址法中，当要插入一个元素时，可以连续地检查散列表的个各项（连续检查是可以通过不同的算法获得偏移位），直到找到一个空槽来放置这个元素为止。 2.当查找一个元素时，要检查所有的表项，直到找到所需的元素，或者最终发现元素不在表中。 3.在开放寻址法中，对散列表元素的删除操作执行起来比较困难。当我们从槽i中删除关键字时，不能仅将此位置元素置空。因为这样做的话，会导致在无法判断此位置是否有元素。应该用个特殊的值表示该元素已经删除。 Hi=(H(key) + di) MOD m , [i=1,2，…，k(k=m-1)] 1 1 其中H(key）为散列函数，m为散列表长，di为增量序列，可有下列三种取法: di=1,2,3，…，m-1，称线性探测再散列。 di=1^2,-1^2,2^2,-2^2，⑶^2，…，±（k)^2,(k=m/2）称二次探测再散列。 di=伪随机数序列，称伪随机探测再散列。 1.3.2 再散列法（再散列法）产生碰撞时，再使用另一个散列函数计算地址，直到碰撞不再发生，这种方法不易产生“聚集”，但增加了计算时间（一个地址的产生可能会经过多个散列函数的计算） Hi=Hn(key), [n=1,2 ...,] 1 1 有一个包含一组哈希函数 H1…Hn 的集合。当需要从哈希表中添加或获取元素时，首先使用哈希函数 H1。如果导致碰撞，则尝试使用 H2，以此类推，直到 Hn。所有的哈希函数都与 H1 十分相似，不同的是它们选用的乘法因子。 1.3.3 拉链法产生碰撞时，把哈希到同一个槽中的所有元素都放到一个链表中。拉链法采用额外的数据结构来处理碰撞，其将哈希表中每个位置（slot）都映射到了一个链表。 1.3.4 公共溢出区建立一个公共溢出区，当发生碰撞时，把碰撞元素放到缓冲区。 1.4 负载因子负载因子(load factor)，它用来衡量哈希表的空/满程度，一定程度上也可以体现查询的效率，计算公式为: 负载因子 = 总键值对数 / 箱子个数 1 1 负载因子越大，意味着哈希表越满，越容易导致冲突，性能也就越低。因此，一般来说，当负载因子大于某个常数(可能是 1，或者 0.75 等)时，哈希表将自动扩容。 2红黑树的复习 2.HashMap 2.1 HashMap的定义 public class HashMapK,V extends AbstractMapK,V implements MapK,V,Cloneable, Serializable { /** 默认的哈希表