- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Hash表构建方法编程方法
散列(Hashing)存贮 假定键值均是正整数. 散列存贮是通过对结点的键值做某种运算来确定具有该键值的结点的存放位置。 设有线性表F=(k1,k2,…,kn-1)和数组T[m],而结点ki的键值为Keyi,记F中所有结点的键值的集合为S. h(x)是从S到整数区间[0,m-1]上的一个一一对应函数。 对于F中的任一结点Ki,都有一个h(keyi)的唯一值与之对应, Ki存放在数组T[m]中的位置就由h(keyi)决定。 这种存贮线性表F的方法,称为散列存贮。称函数h(x)为散列函数(HASH函数)。 称存放结点的数组T(m)为散列表(Hash表). 设F是含有六个结点的线性表,其中K0=(9,e) ,k1=(12,b), k2=(20,e), K3=(26,a), k4=(34,d), k5=(48,f). 若取散列函数h(x)=x mod 10,并使用能存放十个结点的数组T[10]作为Hash表,则下图表示了F的散列存贮的状况。 0 1 2 3 4 5 6 7 8 9 如果我们想找到key4=34的结点K4,那么只要计算出 34 mod 10=4 就能在数组元素T[4]中找到它。 出现h(keyi)=h(keyj),称这种情况是冲突。 散列存贮的两个主要问题是:一是选取散列函数;二是选取解决冲突的办法。 静态散列方法 散列方法在表项存储位置与其关键码之间建立一个确定的对应函数关系Hash( ),使每个关键码与结构中一个唯一存储位置相对应: Address = Hash ( Rec.key ) 在搜索时, 先对表项的关键码进行函数计算,把函数值当做表项的存储位置, 在结构中按此位置取表项比较。若关键码相等, 则搜索成功。在存放表项时, 依相同函数计算存储位置, 并按此位置存放。这种方法就是散列方法。 在散列方法中使用的转换函数叫做散列函数。按此方法构造出来的表或结构就叫做散列表。 使用散列方法进行搜索不必进行多次关键码的比较, 搜索速度比较快, 可以直接到达或逼近具有此关键码的表项的实际存放地址。 散列函数是一个压缩映象函数。关键码集合比散列表地址集合大得多。因此有可能经过散列函数的计算,把不同的关键码映射到同一个散列地址上,这就产生了冲突。 示例:有一组表项,其关键码分别是 12361, 07251, 03309, 30976 采用的散列函数是 hash(x) = x % 73 + 13420 其中,“%”是除法取余操作。 则有:hash(12361) = hash(07250) = hash(03309) = hash(30976) = 13444。就是说, 对不同的关键码, 通过散列函数的计算, 得到了同一散列地址。我们称这些产生冲突的散列地址相同的不同关键码为同义词。 由于关键码集合比地址集合大得多, 冲突很难避免。所以对于散列方法, 需要讨论以下两个问题: 散列函数 一、开式寻址法解决冲突 假定键值是大于零的整数,所选用的Hash函数是h(x),并用数组t[m]作为Hash表,这个表共有m个位置。 1.建立Hash表的插入运算。 为了把键值k存入Hash表,先计算出h(k)=i. 如果t[i] 是一个空位置(即t[i]=0),那么把k存入t[i],插入过程结束; 如果t[i]不是空位置(即t[i]≠0),那么再判断t[i]是否等于k, 若t[i]=k,则键值k已在Hash表中,插入过程结束; 否则,t[i]已被另一个键值所占用(发生冲突),此时必须为k找另一个空位置,最简单的办法是进行线性探测,我们可使用下面的循环探测地址序列: (i+1) mod m (i+2) mod m …… (i+m-1) mod m 一旦找到一个空位置,就把k存入刚探测到的空位置上,插入过程结束; 如果用完整个探测地址序列还没有找到空位置,那么Hash表满,插入失败,过程结束。 例 Hash(x)=x%10 Hash (1) = 1 Hash (4) = 4 Hash (11) = 1 Hash (31) = 1 Hash (20) = 0 Hash (7) = 7 Hash (50) = 0 Hash (14) = 4 设散列表 HT[26], m = 26。采用线性探查法处理冲突, 则散列结果如图所示。 2.查找键值k 首先计算出h(k)=i. 如果t[i]=k,则查找成功,查找过程结束; 如果t[i]不等于k,那么必须按照上面所给出的循环探测地址序列进行查找
文档评论(0)