- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章 集合 集合——是—种逻辑结构,其特点是元素之间没有什么联系,其逻辑关系集合为空集,只是共处于一个集合当中。 查找——也叫检索,是根据给定的某个值,在表中确定一个关键字等于给定值的记录或数据元素 关键字——是数据元素中某个数据项的值,它可以标识一个数据元素 查找方法评价 查找速度 占用存储空间多少 算法本身复杂程度 平均查找长度ASL(Average Search Length) 顺序查找 查找过程:从表的一端开始逐个进行记录的关键字和给定值的比较,如果某个记录的关键字等于k,则查找成功,否则查找失败。 算法描述 顺序表查找程序实现 猜字游戏 47 折半查找 查找过程:每次将待查记录所在区间缩小一半 适用条件:采用顺序存储结构的有序表 算法实现 设表长为n,low、high和mid分别指向待查元素所在区间的上界、下界和中点,k为给定值 初始时,令low=1,high=n,mid=?(low+high)/2? 让k与mid指向的记录比较 若k==r[mid].key,已查到 若kr[mid].key,则high=mid-1,在表的前半部分继续查找 若kr[mid].key,则low=mid+1,在表的后半部分继续查找 重复上述操作,直至lowhigh时,查找失败 算法描述 折半查找非递归算法 散列查找 基本思想:在记录的存储地址和它的关键字之间建立一个确定的对应关系;这样,不经过比较,一次存取就能得到所查元素的查找方法 定义 散列函数——在记录的关键字与记录的存储地址之间建立的一种对应关系叫哈希函数 散列函数是一种映象,是从关键字空间到存储地址空间的一种映象 散列函数可写成:addr(ai)=H(ki) ai是表中的一个元素 addr(ai)是ai的存储地址 ki是ai的关键字 散列表——应用散列函数,由记录的关键字确定记录在表中的地址,并将记录放入此地址,这样构成的表叫散列表 散列查找——又叫哈希查找,利用散列函数进行查找的过程叫哈希查找 从例子可见: 散列函数只是一种映象,所以散列函数的设定很灵活,只要使任何关键字的哈希函数值都落在表长允许的范围之内即可 冲突:key1?key2,但H(key1)=H(key2)的现象叫冲突 同义词:具有相同函数值的两个关键字,叫该散列函数的同义词 散列函数通常是一种压缩映象,所以冲突不可避免,只能尽量减少;同时,冲突发生后,应该有处理冲突的方法 散列函数的构造方法 直接定址法 构造:取关键字或关键字的某个线性函数作散列地址,即H(key)=key 或 H(key)=a·key+b 特点 直接定址法所得地址集合与关键字集合大小相等,不会发生冲突 实际中能用这种散列函数的情况很少 数字分析法 构造:对关键字进行分析,取关键字的若干位或其组合作散列地址 适于关键字位数比散列地址位数大,且可能出现的关键字事先知道的情况 平方取中法 构造:取关键字平方后中间几位作散列地址 适于不知道全部关键字情况 key=4731,47312如果地址长度为3位,则可以取第三位到第五位作为散列地址,即有h1(4731)=382, 折叠法 构造:将关键字分割成位数相同的几部分,然后取这几部分的叠加和(舍去进位)做散列地址 种类 移位叠加:将分割后的几部分低位对齐相加 间界叠加:从一端沿分割界来回折送,然后对齐相加 适于关键字位数很多,且每一位上数字分布大致均匀情况 除留余数法 构造:取关键字被某个不大于哈希表表长m的数p除后所得余数作散列地址,即H(key)=key MOD p,p?m 特点 简单、常用,可与上述几种方法结合使用 p的选取很重要;p选的不好,容易产生同义词 随机数法 构造:取关键字的随机函数值作散列地址,即H(key)=random(key) 适于关键字长度不等的情况 选取散列函数,考虑以下因素: 计算散列函数所需时间 关键字长度 散列表长度(散列地址范围) 关键字分布情况 记录的查找频率 处理冲突的方法 开放定址法 方法:当冲突发生时,形成一个探查序列;沿此序列逐个地址探查,直到找到一个空位置(开放的地址),将发生冲突的记录放到该地址中,即Hi=(H(key)+di)MOD m,i=1,2,……k(k?m-1) 其中:H(key)——散列函数 m——散列表表长 di——增量序列 分类 线性探测再散列:di=1,2,3,……m-1 二次探测再散列:di=12,-12,22,-22,32,……±k2(k?m/2) 伪随机探测再散列:di=伪随机数序列 双重散列法 方法:构造若干个散列函数,当发生冲突时,计算下一个哈希地址,即:Hi=Rhi(key) i=1,2,……k 其中:Rhi——不同的散列函数 特
文档评论(0)