哈希算法介绍.doc

下载文档 降价啦

6
0
约1.81千字
约 7页
2017-06-08 发布于河南
举报
版权申诉
保障服务

哈希算法介绍.doc

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

哈希算法介绍

哈希算法简介目录 1哈希算法概念 2 2哈希函数 3 3冲突的解决方法 3 4哈希算法应用 4 关键词：算法、哈希、c语言摘要：哈希算法在软件开发和Linux内核中多次被使用，由此可以见哈希算法的实用性和重要性。本文介绍了哈希算法的原理和应用，并给出了简略的代码实现，以便读者理解。 1哈希算法概念哈希算法将任意长度的二进制值映射为固定长度的较小二进制值，这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母，随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入，在计算上是不可能的，所以数据的哈希值可以检验数据的完整性。哈希表是根据设定的哈希函数H(key)和处理冲突方法将一组关键字映象到一个有限的地址区间上，并以关键字在地址区间中的作为记录在表中的存储位置，这种表称为哈希表，所得存储位置称为哈希地址。作为线性数据结构与表格和队列等相比，哈希表无疑是查找速度比较快的一种。通常的习惯是让项从0到 TableSize-1之间变化。将每个键映射到0到TableSize-1 这个范围中的某个数，并且将其放到适当的单元中，这个映射就称为散列函数（hash funciton）。如右图，john被散列到3，phil被散列到4，dave 被散列到6，mary被散列到7. 这是哈希的基本思想。剩下的问题则是要选择一个函数，决定当两个键散列到同一个值的时候（称为冲突），应该做什么。 2哈希函数通常，键是字符串，一种选择方法是把字符串中字符ASCII码值加起来。 unsigned int hash( const char * key, int tableSize) { unsigned int hastVal = 0; for( int i = 0; i strlen(key); i++) hashVal += key[ i ]; return hashVal % tableSize; } 通过对ASCII码总和取tableSize的余数，来确定哈希值。这是个简单的示例，实现起来很简单而且能够很快地算出答案。不过，如果表很大，则函数不会很好地分配键。由于ASCII字符的值最多为127，如果输入的key，都是长度比较小的字符串，那么返回的键值（哈希值）就会集中在哈希表的头部，这样就会分配不均匀。好的哈希算法这部分会非常复杂，这里仅仅做个介绍。在下面的哈希算法应用中会介绍linux内核如何使用哈希算法管理网络设备结构。 3冲突的解决方法在使用哈希算法时，除了哈希函数之外，还需要注意的是冲突（两个键散列到同一个值的时候）的处理。常用的处理方式有分离链接法、线性探测、平方探测。由于线性探测和平方探测涉及到一些数学问题，本文就介绍分离链接法。分离链接法也比较简单，其做法为将散列到同一个值的所有元素保留到一个链表中。如上图所示，所有哈希表项对应一个链表，这样只要将冲突项放入链表就行，当查找时先找到链表，然后在比较链表上项的键，得到想要的项，这个方法比较容易实现，但是会增加查找的耗时，原来只需计算哈希值，现在增加了对链表项的比较功能。 4哈希算法应用下面看看linux内核中网络设备，是怎么样通过设备名获取相应设备的net_device结构体。在这个过程中，使用了哈希算法，并且使用了分离链接法解决冲突的问题。使用哈希算法可以提高查询速度，如果使用链表，查询时需要逐一比较，效率低下。 dev_name_head为哈希表，保存了所有项的链表头。 1 NETDEV_HASHBITS 为表的大小。 full_name_hash为哈希函数，其主要目的是为了分布均匀避免冲突，这样可以提高查找效率。这个应用比较简单，但是清晰的展现哈希算法的架构，而且容易理解。哈希算法应用很多场景，比如管理组播MAC地址，文件系统，数据库，数据校验等等。有兴趣可以深入研究，可以拓宽编程思路。哈希算法简介第5页共8页