《数据结构与算法》第10章.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《数据结构与算法》第10章

数据结构与算法 第二部分 数据结构 第10章 跳表和散列表 10.1?? 字典 10.2?? 跳表 10.3 散列表?? 10.1 字典 10.1?? 字典 10.2?? 跳表 10.3 散列表?? 字典(dictionary)是记录的集合。字典的每个词条是一个记录,有关单词是该记录的关键字(key),词条中还包含其它信息,不同记录的关键字值各不相同。对字典的存取通过关键字进行。可以认为字典是一种特殊的集合。字典上的基本运算与ADT 8-1的集合抽象数据类型所定义的相同,主要包括搜索、插入和删除。 可以扩充字典的定义使之允许包括重复记录。有重复记录的字典(dictionary with duplicates),允许字典中有多个相同关键字值的记录,在实现搜索、插入和删除操作时需要一个规则来消除歧义。也就是说,如果要搜索(或删除)关键字值为k的记录,在多个具有相同关键字值的记录中究竟返回哪一个。 10.3 散 列 表 10.1?? 字典 10.2?? 跳表 10.3 散列表?? 10.3.1 散列技术 散列表是表示集合和字典的另一种有效方法。它提供了一种完全不同的存储和搜索方式:通过将关键字值映射到表中某个位置上来存储元素,而后根据关键字值直接访问。 Loc(key)=h(key) 其中,Loc(key)表示关键字值为key的元素的存储位置。 (1)这个把关键字值映射到位置的函数h称为散列函数; (2)这样建立的表称为散列表。 10.3.2 散列函数 构造一个散列函数的方法很多,但究竟什么是“好”的散列函数?一个理想的散列函数h应当满足下列条件:(1)能快速计算;(2)具有均匀性。 假定散列表长度为M,那么,散列函数h将关键字值转换成[0,M-1]中的整数,即0?h(key)M。一个均匀的散列函数应当是:如果key是从关键字值集合中随机选取的一个值,则h(key)以同等概率取区间[0,M-1]中的每一个值。 10.3.3 拉链法 解决冲突也称为“溢出”处理技术。有两种常用的解决冲突的方法:拉链的方法和开地址法。拉链的方法也称开散列法,而开地址法又称闭散列法。 采用拉链的方法建立散列表,在极端情况下,散列表中全部为同义词,所以,最坏情况下,为了搜索一个关键字值,需检查全部n个元素。一般情况下有n个元素的散列表的链表的平均长度为n/M。 10.3.4 开地址法 地址h(key)被称为基位置 探查表中空闲位置的探查序列形如: h(key),(h(key)+p(1))mod M,?, (h(key)+p(i))mod M,? 根据生成探查序列的规则不同,可以有线性探查法、伪随机探查法、二次探查法和双散列法。 10.3.5 线性探查法 线性探查法是一种最简单的开地址法。它使用下列循环探查序列: h(key),h(key)+1,?,M-1,0,?,h(key)-1 从基位置h(key)开始,探查该位置是否被占用,即是否为空位置,如果被占用,则继续检查位置h(key)+1,若该位置也已占用,再检查由探查序列规定的下一个位置,?。 可以将线性探查法的探查序列记为: hi=(h(key)+i) mod M 对i=0,1,2,…,M-1 10.3.6 其它开地址法 基本聚集:许多元素在散列表中连成一片, 理想的探查序列应当是散列表位置的一个随机排列。以后搜索关键字时,须再生同样的探查序列。 Data Structures in C++ 冲突和同义词 建立全国省、市、自治区的人口统计简表。 h(Hebei)=h(Henan)=h(Hubei)=h(Hunan)=8 h(Shandong)= h(Shanxi)= h(Shanghai)= h(Sichuan)=19 所谓冲突,是指对于关键字集合中的两个关键字值Ki和Kj,当Ki?Kj时,有h(Ki)=h(Kj),h是散列函数。具有相同散列函数值的关键字值,对该散列函数而言称为同义词 。 冲突是不可避免的。 例一:关键字值集合有31个元素,如果我们选择一个有40个元素的记录数组的散列表,也就是说散列地址的范围从0到39。 C4031.31!=40!/9!?1042 4031?4*1049 目前比较通用的散列函数有下列几种: 除留余数法(Division) 除留余数法的散列函数的形式如下: h(key)=key mod M 其中,key是关键字,M是散列表的大小。 M的选择十分重要,如果M选择不当,在某些选择关键字值的方式下,会造成严重冲突。例如,若M=2k,则h(ke

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档