- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
福州大学数学与计算机科学学院 第9章 符号表 学习要点: ? 理解抽象数据类型符号表的概念。 ? 掌握数组实现符号表的方法。 ? 理解开散列和闭散列的概念。 ? 掌握用开散列表实现符号表的方法。 ? 掌握除余法、数乘法、平方取中法、基数转换法和随机数法等散列函数构造方法。 ? 掌握采用线性重新散列技术的闭散列表实现符号表的方法。 9.1 实现符号表的简单方法 9.1.1 引言 ADT符号表的概念 以集合为基础,并支持Member、Insert和Delete三种运算的抽象数据类型叫做符号表。 ADT符号表的应用 公司的客户符号表 一个地区的固定/移动电话号码符号表 软件开发中的数据符号表 网上的在线符号表 互联网/企业网/局域网网管中的IP地址符号表等等可以用表示集合的链表或位向量来实现符号表。 实现符号表的另一简单方法是用一个定长数组来存储集合中的元素。 这种方法的优点是结构简单,易于操作。 它的缺点是所支持的符号表运算的时间复杂度较高。 表示集合大小受数组大小的限制。 9.1 实现符号表的简单方法 9.1.2 用固定数组实现符号表 数组实现符号表的结构定义如下: typedef struct atab *Table; Typedef struct atab{int arraysize;int last;SetItem *data; }Atab; ? 9.1 实现符号表的简单方法 9.1.2 用固定数组实现符号表 优点: 结构简单,实现操作的逻辑简单。 缺点: 所表示的集合的大小受到数组大小的限制。 三个基本操作在最坏情况下都需要O(n)。 通常集合元素并不占满整个数组,空间没有得到充分利用。 9.2 用散列表实现符号表 实现符号表的另一个重要技巧是散列(hashing)技术。用散列来实现符号表可以使符号表的每个运算所需的平均时间是一个常值。 在最坏情况下每个运算所需的时间正比于集合的大小。 散列有两种形式,一种是开散列(外部散列),它将符号表元素存放在一个潜无穷的空间里,能处理任意大小的集合。 另一种是闭散列(内部散列),它使用一个固定大小的存储空间,所能处理的集合大小不能超过其存储空间大小。 9.2.1 开散列 开散列的基本思想是将集合的元素(可能有无穷多个)划分成有限个类。例如,划分为0,1,…,B-1这B个类。 用散列函数h将集合中的每个元素x映射到0,1,…,B-1之一,h(x)的值就是x所属的类。 函数h(x)的值称为元素x的散列值。 每一个类称为一个桶,并且称x属于桶h(x)。 期望散列能均匀,使得当桶数组的规模与符号表的规模同阶时,桶数组的每一个桶中大致有常数个元素,从而对符号表的三个基本操作都只需要常数时间。 这里的问题是如何散列即如何构造散列(映射)函数去达到设想的期望? int hash1(char * x) { int len,i,j=0;len=strlen(x); for(int i=0;ilen ;i++) j+=x[i]; return j%101; } 用开散列表实现的符号表结构OpenHashTable定义如下: typedef struct open *OpenHashTable; typedef struct open{int size;/*桶数组的大小*/int (*hf) (SetItem x); /*散列函数*/List *ht; /*桶数组*/ }Open; 由此可以看出,开散列表是将数组和表结合在一起的一种数据结构,并且利用二者的优点,克服二者的缺点。 9.2.2 闭散列 闭散列表将表中元素直接存放在桶单元中。 闭散列表中的每个桶都只能存放集合中的一个元素。 当要把元素x存放到桶h(x)中,但发现这个桶已被其它元素占用时,就发生了冲突。 为了解决闭散列中的冲突,需要使用重新散列技术,使得发生冲突时,按重新散列技术可以选取一个桶序列h1(x),h2(x)…。 只要桶单元尚未全部被占用,顺序试探这个桶序列中各个桶,一定能找到一个空桶来存放元素x。 最简单的重新散列技术是线性重新散列技术,即当散列函数为h(x),桶数为B时,取 hi(x)=(h(x)+i)%B,i=1,2,…,B-1 9.2.2 闭散列 检测一个元素x是否在一个闭散列表中,只要顺序查看桶h(x),h1(x),h2(x),…。 在某个桶中找到x,则x在这个闭散列表中。 没有找到x而遇一空桶,是否可以断定x不在这个闭散列表中? 如果在这个闭散列表中没有执行过删除操作,可以断定x不在闭散列表中。 如果对这个闭散列表执行过删除操作,就无法确定所遇到的空桶在当初存放x时是否曾被占用,因而也就无法确定x是否在闭散列表中。 解决这个问题的一个有效方法是对ht[ ]的
文档评论(0)