数据结构-用面向对象语言描述-殷人昆-第六章报告.ppt

数据结构-用面向对象语言描述-殷人昆-第六章报告.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据结构-用面向对象语言描述-殷人昆-第六章报告

第六章 集合与字典 第六章 集合与字典 集合 字典 散列 集合及其表示 集合是成员(元素)的一个群集。集合中的成员可以是原子(单元素),也可以是集合。 集合的成员必须互不相同。 在算法与数据结构中所遇到的集合,其单元素通常是整数、字符、字符串或指针,且同一集合中所有成员具有相同的数据类型。 例:colour = { red, orange, yellow, green, black, blue, purple, white } 散列表(Hash Table) 理想的搜索方法是可以不经过比较,一次直接从字典中得到要搜索的元素。 如果在元素存储位置与其关键码之间建立一个确定的对应函数关系Hash(), 使得每个关键码与结构中一个唯一的存储位置相对应: Address = Hash(key) 在插入时依此函数计算存储位置并按此位置存放。在搜索时对元素的关键码进行同样的计算,把求得的函数值当做元素存储位置, 在结构中按此位置搜索。这就是散列方法。 在散列方法中所用转换函数叫做散列函数。按此方法构造出来的表叫做散列表。 散列函数是一个压缩映象函数。关键码集合比散列表地址集合大得多。因此有可能经过散列函数的计算,把不同的关键码映射到同一个散列地址上,这就产生了冲突。 示例:有一组表项,其关键码分别是 12361, 07251, 03309, 30976 采用的散列函数是 hash(x) = x % 73 + 13420 则有 hash(12361) = hash(07250) = hash(03309) = hash(30976) = 13444。 就是说,对不同的关键码,通过散列函数的计算,得到了同一散列地址。称这些产生冲突的散列地址相同的不同关键码为同义词。 由于关键码集合比地址集合大得多, 冲突很难避免。所以对于散列方法, 需要讨论以下两个问题: 散列函数 对于给定的一个关键码集合,选择一个计算 简单且地址分布比较均匀的散列函数,避免或尽量减少冲突; 拟订解决冲突的方案。 构造散列函数时的几点要求: 散列函数应是简单的,能在较短的时间内 计算出结果。 散列函数的定义域必须包括需要存储的全部关键码,如果散列表允许有 m 个地址 时,其值域必须在 0 到 m-1 之间。 散列函数计算出来的地址应能均匀分布在整个地址空间中 : 若 key 是从关键码集合中随机抽取的一个关键码, 散列函数应能以同等概率取0 到 m-1 中的每一个值。 除留余数法 设散列表中允许地址数为m,取一个不大于 m,但最接近于或等于 m 的质数 p 作为除数,用以下函数把关键码转换成散列地址: hash (key) = key % p p ? m的质数 其中,“%”是整数除法取余的运算,要求这时的质数 p 不是接近 2 的幂。 示例: 有一个关键码 key = 962148,散列表大小 m = 25,即 HT[25]。取质数 p = 23。散列函数 hash(key) = key % p。则散列地址为 hash(962148) = 962148 % 23 = 12。 可按计算出的地址存放记录。注意, 使用散列函数计算出的地址范围是 0 到 22,而 23、24 这几个地址实际上不能用散列函数计算出来,只能在处理冲突时达到这些地址。 折叠法 此方法把关键码自左到右分成位数相等的几部分, 每一部分的位数应与散列表地址位数相同, 只有最后一部分的位数可以短一些。 把这些部分的数据叠加起来, 就可以得到具有该关键码的记录的散列地址。 有两种叠加方法: 移位法:把各部分最后一位对齐相加; 分界法:各部分不折断,沿各部分的分界来回折叠, 然后对齐相加。 示例: 设给定的关键码为 key = 23938587841, 若存储空间限定 3 位, 则划分结果为每段 3 位。 上述关键码可划分为 4 段: 239 385 878 41 把超出地址位数的最高位删去, 仅保留最低的3 位,做为可用的散列地址。 处理冲突的闭散列方法(开地址法) 因为任一种散列函数也不能避免产生冲突,因此选择好的解决冲突的方法十分重要。 为了减少冲突,对散列表加以改造。若设散列表HT有 m 个地址, 将其改为 m 个桶。其桶号与散列地址一一对应, 第 i (0≤i m) 个桶的桶号即为第 i 个散列地址。 每个桶可存放 s 个表项, 这些表项的关键码互为同义词。如果对两个不同表项的关键码用散列函数计算得到同一个散列地址

文档评论(0)

586334000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档