ch10-散列结构概要.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ch10-散列结构概要

散列 散列函数 开地址散列向量 桶散列 散列 (Hashing) 在现实中经常遇到按给定的值进行查询的事例。为此, 必须考虑在记录的存放位置和用以标识它的数据项(称为关键码)之间的对应关系,选择适当的数据结构, 很方便地根据记录的关键码检索到对应记录的信息。 表项的存放位置及其关键码之间的对应关系可以用一个二元组表示: ( 关键码key,表项位置指针addr ) 这个二元组构成搜索某一指定项目的索引项。 考虑到搜索效率, 可以考虑散列表结构。 静态散列方法 散列方法在表项存储位置与其关键码之间建立一个确定的对应函数关系Hash( ),使每个关键码与结构中一个唯一存储位置相对应: Address = Hash ( Rec.key ) 在搜索时, 先对表项的关键码进行函数计算,把函数值当做表项的存储位置, 在结构中按此位置取表项比较。若关键码相等, 则搜索成功。在存放表项时, 依相同函数计算存储位置, 并按此位置存放。此方法称为散列方法。 在散列方法中使用的转换函数叫做散列函数。按此方法构造出来的表或结构就叫做散列表。 使用散列方法进行搜索不必进行多次关键码的比较, 搜索速度比较快, 可以直接到达或逼近具有此关键码的表项的实际存放地址。 散列函数是一个压缩映象函数。关键码集合比散列表地址集合大得多。因此有可能经过散列函数的计算,把不同的关键码映射到同一个散列地址上,这就产生了冲突。 冲突示例:有一组表项,其关键码分别是 12361, 07251, 03309, 30976 采用的散列函数是 hash(x) = x % 73 + 13420 则有:hash(12361) = hash(07250) = hash(03309) = hash(30976) = 13444。就是说, 对不同的关键码, 通过散列函数的计算, 得到了同一散列地址。我们称这些产生冲突的散列地址相同的不同关键码为同义词。 由于关键码集合比地址集合大得多, 冲突很难避免。所以对于散列方法, 需要讨论以下两个问题: 对于给定的一个关键码集合, 选择一个计算简单且地址分布比较均匀的散列函数; 避免或尽量减少冲突; 直接映射法 此类函数取关键码的某个线性函数值作为散列地址: Hash ( key ) = a * key + b { a, b为常数 } 这类散列函数是一对一的映射,一般不会产生冲突。但是,它要求 示例:有一组关键码如下:{ 942148, 941269, 940527, 941630, 941805, 941558, 942047, 940001 }。散列函数为 Hash (key) = key - 940000 Hash (942148) = 2148 Hash (941269) = 1269 Hash (940527) = 527 Hash (941630) = 1630 Hash (941805) = 1805 Hash (941558) = 1558 Hash (942047) = 2047 Hash (940001) = 1 可以按计算出的地址存放记录。 数字分析法 设有n 个 d 位数,每一位可能有 r 种不同的符号。这r 种不同符号在各位上出现的频率不一定相同。 可根据散列表的大小,选取其中各种符号分布均匀的若干位作为散列地址。 计算各位数字中符号分布均匀度 ? k 的公式: 其中, 表示第 i 个符号在第 k 位上出现的次数,n/r 表示各种符号在 n 个数中均匀出现的期望值。计算出的? k值越小,表明在该位 (第 k 位) 各种符号分布得越均匀。 数字分析法仅适用于事先明确知道表中所有关键码每一位数值的分布情况,它完全 如果换一个关键码集合,选择哪几位要重新决定。 示例: 有一个关键码 key = 962148, 散列表大小 m = 25, 即 HT[25]。取质数 p= 23。 散列函数 hash ( key ) = key % p 散列地址为 hash ( 962148 ) = 962148 % 23 = 12 可以按计算出的地址存放记录。需要注意的是, 使用上面的散列函数计算出来的地址范围是 0到 22, 因此, 从23到24这几个散列地址实际上在一开始是不可能用散列函数计算出来的, 只可能在处理冲突时达到这些地址。 平方取中法 此方法在

文档评论(0)

1520520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档