《数据结构与算法》第10章.ppt

下载文档 降价啦

0
0
约4.24千字
约 34页
2017-12-07 发布于江西
举报
版权申诉
保障服务

《数据结构与算法》第10章.ppt

1、本文档共34页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

《数据结构与算法》第10章

数据结构与算法第二部分数据结构第10章跳表和散列表 10.1?? 字典 10.2?? 跳表 10.3 散列表?? 10.1 字典 10.1?? 字典 10.2?? 跳表 10.3 散列表?? 字典（dictionary）是记录的集合。字典的每个词条是一个记录，有关单词是该记录的关键字（key），词条中还包含其它信息，不同记录的关键字值各不相同。对字典的存取通过关键字进行。可以认为字典是一种特殊的集合。字典上的基本运算与ADT 8-1的集合抽象数据类型所定义的相同，主要包括搜索、插入和删除。可以扩充字典的定义使之允许包括重复记录。有重复记录的字典(dictionary with duplicates)，允许字典中有多个相同关键字值的记录，在实现搜索、插入和删除操作时需要一个规则来消除歧义。也就是说，如果要搜索（或删除）关键字值为k的记录，在多个具有相同关键字值的记录中究竟返回哪一个。 10.3 散列表 10.1?? 字典 10.2?? 跳表 10.3 散列表?? 10.3.1 散列技术散列表是表示集合和字典的另一种有效方法。它提供了一种完全不同的存储和搜索方式：通过将关键字值映射到表中某个位置上来存储元素，而后根据关键字值直接访问。 Loc(key)=h(key) 其中，Loc(key)表示关键字值为key的元素的存储位置。（1）这个把关键字值映射到位置的函数h称为散列函数；（2）这样建立的表称为散列表。 10.3.2 散列函数构造一个散列函数的方法很多，但究竟什么是“好”的散列函数？一个理想的散列函数h应当满足下列条件：（1）能快速计算；（2）具有均匀性。假定散列表长度为M，那么，散列函数h将关键字值转换成[0,M-1]中的整数，即0?h(key)M。一个均匀的散列函数应当是：如果key是从关键字值集合中随机选取的一个值，则h(key)以同等概率取区间[0，M-1]中的每一个值。 10.3.3 拉链法解决冲突也称为“溢出”处理技术。有两种常用的解决冲突的方法：拉链的方法和开地址法。拉链的方法也称开散列法，而开地址法又称闭散列法。采用拉链的方法建立散列表，在极端情况下，散列表中全部为同义词，所以，最坏情况下，为了搜索一个关键字值，需检查全部n个元素。一般情况下有n个元素的散列表的链表的平均长度为n/M。 10.3.4 开地址法地址h(key)被称为基位置探查表中空闲位置的探查序列形如： h(key),(h(key)+p(1))mod M,?, (h(key)+p(i))mod M,? 根据生成探查序列的规则不同，可以有线性探查法、伪随机探查法、二次探查法和双散列法。 10.3.5 线性探查法线性探查法是一种最简单的开地址法。它使用下列循环探查序列： h(key),h(key)+1,?,M-1,0,?,h(key)-1 从基位置h(key)开始，探查该位置是否被占用，即是否为空位置，如果被占用，则继续检查位置h(key）+1，若该位置也已占用，再检查由探查序列规定的下一个位置，?。可以将线性探查法的探查序列记为： hi=(h(key)+i) mod M 对i=0,1,2,…,M-1 10.3.6 其它开地址法基本聚集：许多元素在散列表中连成一片，理想的探查序列应当是散列表位置的一个随机排列。以后搜索关键字时，须再生同样的探查序列。 Data Structures in C++ 冲突和同义词建立全国省、市、自治区的人口统计简表。 h(Hebei)=h(Henan)=h(Hubei)=h(Hunan)=8 h(Shandong)= h(Shanxi)= h(Shanghai)= h(Sichuan)=19 所谓冲突，是指对于关键字集合中的两个关键字值Ki和Kj，当Ki?Kj时，有h(Ki)=h(Kj)，h是散列函数。具有相同散列函数值的关键字值，对该散列函数而言称为同义词。冲突是不可避免的。例一：关键字值集合有31个元素，如果我们选择一个有40个元素的记录数组的散列表，也就是说散列地址的范围从0到39。 C4031.31！=40！/9！?1042 4031?4*1049 目前比较通用的散列函数有下列几种：除留余数法（Division）除留余数法的散列函数的形式如下： h(key)=key mod M 其中，key是关键字，M是散列表的大小。 M的选择十分重要，如果M选择不当，在某些选择关键字值的方式下，会造成严重冲突。例如，若M=2k，则h(ke