- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
散列文件的操作 插入: 为了插入一个搜索码为Ki的记录,通过计算h(Ki)获得存放该记录的桶地址。于是就把这条记录存入桶中或是相应的溢出桶中; 删除: 如果待删除记录的搜索码值是Ki,则计算h(Ki),然后在相应的桶中搜寻此记录并删除它; 基于搜索码值Ki的查找: 首先计算h(Ki),然后在计算出地址的桶中搜索所有的记录。因为不同的搜索码值对应相同的桶地址正是散列文件组织的最大特点。 §8.4散列文件组织 散列函数 如果散列函数设计的不好,就有可能把所有的搜索码值都映射到同一个存储桶中,这时散列就失去了意义。因此,对散列函数的基本要求是: 分布是均匀的:即每个存储桶从所有可能的搜索码值集合中分配到的值的个数差不多相同,例如将大写英文字母分配到5个存储桶中; 分布是随机的:不管搜索码值的实际情况是怎样的,每个存储桶应分配到的搜索码值的个数也差不多相同。例如,假设实际的搜索码值是A、B、C、D、E五个字母。 §8.4散列文件组织 * 第8章 索引和散列 讲课内容: 索引的目的就是为了能够快速地在文件中定位要访问的记录,当然,理想的做法是系统能够直接定位这些记录!为了实现这种访问数据的方式,需要一些附加结构——索引,并将索引同数据文件联系起来。在本章,只要不是特别指明,数据文件一般是指存储数据记录的文件,我们简称文件,而索引文件是指存储索引记录(或称之为索引项)的文件。 ■基本概念 ■散列文件组织 ■SQL中索引的定义 ■顺序索引 ■散列索引 ■多码访问 ■B+树索引文件 ■两种索引的比较■本章总结 §8.1基本概念 基本索引 顺序索引: 基于对值的一种排序; 结构:顺序文件和B树文件 散列索引: 基于将值平均、随机地分布到若干存储桶中: 由1至32个连续的物理块构成的一种存储结构; 与物理块不同的是,存储桶只能包含整记录,即记录可以跨块存储但不能跨桶存储。 一个值所属的存储桶由一个函数来决定,该函数称为散列函数,也叫哈稀函数; 索引结构是散列文件! §8.1基本概念 索引技术的评价标准 没有哪一种索引技术是最好的,每种索引都有自己适合的数据库应用。对索引技术的评价必须考虑以下因素: 访问类型: 能有效支持的数据访问类型,包括根据指定的属性值进行查询,或根据给定属性值的范围进行查询。 访问时间: 访问一个或多个数据项所需要的时间。 插入时间: 在文件中插入一个新数据项所需要的时间,包括找到插入该项的正确位置和修改索引所需要的时间。 §8.1基本概念 索引技术的评价标准 没有哪一种索引技术是最好的,每种索引都有自己适合的数据库应用。对索引技术的评价必须考虑以下因素: 删除时间: 在文件中删除一个数据项所需要的时间,包括找到待删除项的正确位置和修改索引所需要的时间。 更新时间:U = D + I (在位与异位) 空间开销: 索引结构所需要的额外存储空间; 索引是用空间的代价来换取系统性能的提高。 索引实现的难度 决定了该索引技术是否实用、能否推广。 §8.2顺序索引 顺序索引的作用 能迅速地按顺序或随机地访问文件中的记录 顺序索引的结构 在逻辑上按顺序存储搜索码的值,并将搜索码值与包含该搜索码值的记录关联起来。 顺序索引的特征 一个文件可以有多个索引,对应于不同的搜索码。根据索引结构中搜索码值的逻辑顺序和数据文件中记录的物理存储顺序之间的关系,顺序索引分为主索引和辅助索引。 §8.2顺序索引 基本概念 主索引与辅助索引 如果数据文件中记录按照某个搜索码指定的顺序物理存储,则该搜索码对应的索引称为主索引或簇集索引; 相反,搜索码顺序与数据文件中记录的物理顺序不同的那些索引称为辅助索引或非簇集索引; 显然,一个数据文件只能有一个主索引,但可以有多个辅助索引,为什么? 堆文件与索引顺序文件 没有主索引的数据文件就是堆文件; 而拥有主索引的数据文件就是索引顺序文件。 §8.2顺序索引 索引顺序文件 数据文件中的记录按照某个搜索码值的顺序物理存储: §8.2顺序索引 顺序索引的分类 按照索引结构中搜索码值与数据文件中搜索码值的对应关系,顺序索引又分为: 稠密索引 稀疏索引 稠密索引: 对应文件中搜 索码的每一个 值都有一个索 引记录(或索引项),它包括: 搜索码值; 指向具有该搜索码值的第一个数据记录的指针。 §8.2顺序索引 顺序索引的分类 稀疏索引: 只为搜索码的部分值建立索引项; 与稠密索引一样,每个索引项也包括搜索码值和指向具有该搜索码值的第一个数据记录的指针。 问题:如何利用稀疏索引进行查询呢? SQL SERVER 主索引的问题? 搜索码链表的作用 记录的惟一标识是F#:P#:S# 索引中索引项的指针是? 页头: 96字节 数据行,即记录 176 行偏移数组:链表 0 95 Mianus (96)
您可能关注的文档
最近下载
- 畜牧兽医职业生涯规划书 .pdf VIP
- 2024-2025四川遂宁遂宁中学高一上期中化学试题【答案版】.docx VIP
- 15分钟课堂教学.pdf VIP
- 职业技术学院民族音乐与舞蹈专业人才培养方案.docx VIP
- Tolteq 脉冲器 操作手册.pdf VIP
- 人教版部编版小学五年级语文上册《忆读书》教学ppt课件.pptx VIP
- DB50T1310-2022丰都麻辣鸡加工技术规程.pdf VIP
- 2024-2025四川遂宁遂宁中学高一上期中数学试题【答案版】.pdf VIP
- 河北省政府采购评审专家培训验收考核题(6月21日)车上试题【含答案】2025.pdf VIP
- 华东理工大学电路原理与分析期末复习.ppt VIP
原创力文档


文档评论(0)