- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[北京邮电大学数据结构与算法课件]DSC11.ppt
* 第十一章. 外部排序 (Chapter 11. External Sorting) 待排序列记录数量太大,不能全部存放在计算机随机存储器中,排序过程中需对计算机外存进行访问,这种排序过程称为外部排序。 §11.1 外存信息的存取 一、磁带信息的存取: 磁带是在一条塑料薄膜上涂有磁性材料用以记录数据的存储介质。其记录组之间有一定的空隙 IRG(Inter Record Gap),它不是连续运转的设备,读写 二、磁盘信息的存取: 磁盘是在一片塑料薄膜上涂有磁性材料用以记录数据的存储介质。它分成多个磁道(柱面),每个磁道又分为多个扇区,多个磁盘组成的磁盘组还涉及到盘片号(磁头号),磁盘绕轴高速旋转,读写头则沿其一条半径作直线运动以寻道。它也不是 信息只能在运行稳定时进行,且找到要读写的记录也需要一定的绕带时间,因此,在磁带上读写信息所需的时间由两部分组成:TI/O = td + n tw,其中 td 为延迟时间,即读写磁头到达信息所在物理块起始位置所需时间, tw 为传输一个记录的时间。磁带是一种顺序存储设备。 §11.2 外部排序的方法 总体要用归并排序,亦即将待排序列分成若干子序列分别进入内存排成有序序列(初始归并段),再用归并排序将所有归并段排序成一个有序序列。 连续运转的设备,读写信息只能在旋转稳定时进行,且找到要读写的记录也需要一定的寻道、寻扇区时间,因此,在磁盘上读写信息所需的时间由三部分组成:TI/O = tseek + tla + n tw,其中 tseek 为寻道时间(seek time), tla 为寻扇区时间(latency time time), tw 为传输时间(transmission time)。磁盘是一种随机存储设备。 一般情况下,外部排序所需的总时间由三部分构成:内部排序(产生初始归并段)所需时间( m * tIS )、外存信息读写时间( d * tIO )、内部归并所需时间( s * u tmg )。其中 tIS 是为得到一个初始归并段进行内部排序所序的平均时间, tIO 是进行一次外存读写的平均时间, u tmg 是对 u 个记录进行内部归并所需的时间,m 为初始归并段的个数,s 为归并的趟数,d 为总的读写次数。 但由于访问外存储器的时间开销太大,即 tIO 远远大于 tmg ,因此,要提高外部排序速度,就必须减少访问外存的次数。 对同一待排序列而言,外部排序访问外存的总次数 d 与归并的趟数 s 成正比,而对 m 个初始归并段进行 k 路平衡归并所需的趟数 s = log k m ,因此,增加 k 或减少 m 均能减少 s。 利用败者树( tree of loser )可解决这一问题:类似于锦标赛排序的思想,在进行 k 路平衡归并时 ,将相互比较过的关键字值较大的初始归并段号(败者)留在树结点中,将关键字值较小的初始归并段号(胜者)上传,直到找到最终的胜者(最小值的段号);将其归并后,其下一记录将替换它参加新的一轮比赛以找到新的最小值段号;反复此过程,直至全部 k 个初始归并段合并成一个有序序列为止。此时的归并时间为 log2m (n-1) tmg,与 k 无关,但 k 也并非越大越好。 §11.3 多路平衡归并的实现 若单纯增加 k 以减少 s ,将会增加内部归并的时间 u tmg ,这将抵销 d 随 s 减少而得到的效益,如何解决这一矛盾呢? 5 16 12 8 30 5 23 34 16 28 31 12 14 17 8 10 15 30 38 56 b3 b4 b0 b1 b2 [0] [1] [2] [3] [4] 初始归并段 0 b5 5 5 5 5 5 16 0 4 5 16 5 0 3 30 0 2 8 30 8 0 1 12 5 0 5 8 1 3 5 23 23 34 48 23 16 3 16 12 4 12 8 0 1 8 10 10 15 29 10 30 2 10 12 0 1 10 15 15 29 88 5 - 路平衡归并的败者树: 例: §11.4 置换 - 选择排序 … 利用置换-选择排序(replacement-selection sort)可以达到这个目的(也用败者树实现): 置换 - 选择排序是在选择排序的基础上, 当最小关键字记录被选出后,它空出的位置补充进一个新的记录,以后再求最小记录时,不能选择比刚才的最小记录关键字小的记录,只能从大
您可能关注的文档
最近下载
- 深度解析《GBT 44037-2024焦炭溶损率及溶损后强度试验方法》.pptx
- 部编版六年级上册语文第一周(草原-丁香结)达标测评卷 含答案.docx VIP
- 建筑电气安装工程管线预留预埋阶段质量管理.doc VIP
- 激光原理 全套课件.ppt
- 第1.2课《宁夏闽宁镇:昔日干沙滩,今日金沙滩》(课件)-【中职专用】高二语文同步精品课件(高教版2023·职业模块).pptx VIP
- 部编版语文六年级上册 周测卷(一)1草原+2丁香结(含答案).pdf VIP
- 2024年人教版英语九年级上册48个英语音标教学课件.ppt VIP
- 新人教高一英语必修一 课本听力与视频材料原文Unit1.pdf VIP
- 歌乐山音乐之旅.pptx
- 【新教材】统编版高中语文选择性必修:上册+中册+下册 教学计划全套(含教学进度表).pdf VIP
文档评论(0)