- 1、本文档共161页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
索引与散列静态索引结构示例-read
静态索引结构 动态索引结构 散列 可扩充散列 静态索引结构 示例:有一个存放职工信息的数据表, 每一 个职工对象有近 1k 字节的信息, 正好占据一 个页块的存储空间。 假设内存工作区仅能容纳 64k 字节的数据, 在某一时刻内存最多可容纳 64 个对象以供搜索。 如果对象总数有 14400 个, 不可能把所有对象的数据一次都读入内存。无论是顺序搜索或折半搜索, 都需要多次读取外存记录。 如果在索引表中每一个索引项占4个字节, 每个索引项索引一个职工对象, 则 14400 个索引项需要 56.25k 字节, 在内存中可以容纳所有的索引项。 这样只需从外存中把索引表读入内存, 经过搜索索引后确定了职工对象的存储地址, 再经过 1 次读取对象操作就可以完成搜索。 稠密索引:一个索引项对应数据表中一个对象的索引结构。当对象在外存中按加入顺序存放而不是按关键码有序存放时必须采用稠密索引结构,这时的索引结构叫做索引非顺序结构。 稀疏索引:当对象在外存中有序存放时,可以把所有 n 个对象分为 b 个子表(块)存放,一个索引项对应数据表中一组对象(子表)。 在子表中, 所有对象可能按关键码有序地存放, 也可能无序地存放。但所有这些子表必须分块有序, 后一个子表中所有对象的关键码均大于前一个子表中所有对象的关键码。它们都存放在数据区中。 另外建立一个索引表。索引表中每一表目叫做索引项,它记录了子表中最大关键码max _key以及该子表在数据区中的起始位置obj _ addr。 第 i 个索引项是第 i 个子表的索引项, i = 0, 1, …, n-1。这样的索引结构叫做索引顺序结构。 对索引顺序结构进行搜索时,一般分为两级搜索: 先在索引表 ID 中搜索给定值 K, 确定满足 ID[i-1].max_key K ? ID[i].max_key 的 i 值, 即待查对象可能在的子表的序号。 然后再在第 i 个子表中按给定值搜索要求的对象。 索引表是按max_key有序的, 且长度也不大,可以折半搜索,也可以顺序搜索。 各子表内各个对象如果也按对象关键码有序, 可以采用折半搜索或顺序搜索; 如果不是按对象关键码有序, 只能顺序搜索。 索引顺序搜索的搜索成功时的平均搜索长度 ASLIndexSeq = ASLIndex + ASLSubList 其中, ASLIndex 是在索引表中搜索子表位置的平均搜索长度,ASLSubList 是在子表内搜索对象位置的搜索成功的平均搜索长度。 设把长度为 n 的表分成均等的 b 个子表,每个子表 s 个对象,则 b = ?n/s?。又设表中每个对象的搜索概率相等,则每个子表的搜索概率为1/b,子表内各对象的搜索概率为 1/s。 若对索引表和子表都用顺序搜索,则索引顺序搜索的搜索成功时的平均搜索长度为 ASLIndexSeq = (b+1)/2+(s+1)/2 = (b+s)/2 +1 索引顺序搜索的平均搜索长度与表中的对象个数 n 有关,与每个子表中的对象个数 s 有关。在给定 n 的情况下,s 应选择多大? 用数学方法可导出, 当 s = 时, ASLIndexSeq取极小值 +1。这个值比顺序搜索强,但比折半搜索差。但如果子表存放在外存时,还要受到页块大小的制约。 若采用折半搜索确定对象所在的子表, 则搜索成功时的平均搜索长度为 ASLIndexSeq = ASLIndex + ASLSubList ? log2 (b+1)-1 + (s+1)/2 ? log2(1+n / s ) + s/2 倒排表 (Inverted Index List) 对包含有大量数据对象的数据表或文件进行搜索时,最常用的是针对对象的主关键码建立索引。主关键码可以唯一地标识该对象。用主关键码建立的索引叫做主索引。 主索引的每个索引项给出对象的关键码和对象在表或文件中的存放地址。 但在实际应用中有时需要针对其它属性进行搜索。例如,查询如下的职工信息: (1) 列出所有教师的名单; (2) 已婚的女性职工有哪些人? 这些信息在数据表或文件中都存在,但都不是关键码,为回答以上问题,只能到表或文件中去顺序搜索,搜索效率极低。 因此,除主关键码外,可以把一些经常搜索的属性设定为次关键码,并针对每一个作为次关键码的属性,建立次索引。 在次索引中,列出该属性的所有取值,并对每一个取值建立有序链表,把所有具有相同属性值的对象按存放地址递增的顺序或按主关键码递增的顺序链接在一起。 次索引的索引项由次关键码、链表长度和链表本身等三部分组成。 例如,为了回答上述的查询,我们可以分别建立“性别
您可能关注的文档
最近下载
- 13.5 道路运输法律制度(政策与法律法规 第五版).pptx VIP
- RB_T 089-2022 绿色供应链管理体系 要求及使用指南.docx VIP
- 13.4 铁路运输法律制度(政策与法律法规 第五版).pptx VIP
- NBT47025-2012缠绕垫片-标准图集.docx VIP
- 派出所矛盾纠纷排查 化解调研.pdf VIP
- 2025年中国人工智能计算力发展评估报告.pdf VIP
- 三峡郦道元的文言文.ppt VIP
- 高中英语与语文课程融合的实践与反思教学研究课题报告.docx
- 医院优质服务基层行创建资料(优质服务基层行建设工作汇报).pptx VIP
- 打叶复烤机械修理工职业技能竞赛培训综合试题五(答案).docx VIP
文档评论(0)