- 1、本文档共107页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一. 问题的提出 1.待排序的记录数量很大,不能一次装入内存,则无法利用前几节 讨论的排序方法 (否则将引起频繁访问内存); 2.对外存中数据的读/写是以“数据块” 为单位进行的; 读/写外存中一个“数据块”的数据所需要的时间为: TI/O = tseek + tla + n? twm 其中 tseek 为寻查时间(查找该数据块所在磁道) tla 为等待(延迟)时间 n? twm 为传输数据块中n个记录的时间。 1.按可用内存大小,利用内部排序 方法,构造若干( 记录的) 有序子序列,通常称外存中这些记录有序子序列为 “归并段”; 二、外部排序的基本过程 由相对独立的两个步骤组成: 2.通过“归并”,逐步扩大 (记录的)有序子序列的长度,直至外存中整个记录序列按关键字有序为止。 例如:假设有一个含10,000个记录的磁盘 文件,而当前所用的计算机一次只 能对1000个记录进行内部排序,则 首先利用内部排序的方法得到10个 初始归并段,然后进行逐趟归并。 假设进行2?路归并(即两两归并),则 第一趟由10个归并段得到5个归并段; 最后一趟归并得到整个记录的有序序列。 第三趟由 3 个归并段得到2个归并段; 第二趟由 5 个归并段得到3个归并段; 假设“数据块”的大小为200,即每一次访问外存可以读/写200个记录。 则对于10,000个记录,处理一遍需访问外存100次(读和写各50次)。 分析上述外排过程中访问外存(对外 存进行读/写)的次数: 由此,对上述例子而言, 1)求得10个初始归并段需访问外存100次; 2)每进行一趟归并需访问外存100次; 3)总计访问外存 100 + 4 ? 100 = 500次。 外排总的时间还应包括内部排序 所需时间和逐趟归并时进行内部归并 的时间,显然,除去内部排序的因素 外,外部排序的时间取决于逐趟归并 所需进行的“趟数”。 例如,若对上述例子采用5?路归并, 则只需进行2趟归并,总的访问外存的 次数将压缩到 100 + 2 ? 100 = 300 次。 一般情况下,假设待排记录序列 含 m 个初始归并段,外排时采用 k?路 归并,则归并趟数为 ?logkm?,显然, 随之k的增大归并的趟数将减少,因此 对外排而言,通常采用多路归并。k 的 大小可选,但需综合考虑各种因素。 1. 了解排序的定义和各种排序方法的特点。熟悉各种方法的排序过程及其依据的原则。基于“关键字间的比较”进行排序的方法可以按排序过程所依据的不同原则分为插入排序、交换排序、选择排序、归并排序和计数排序等五类。 2. 掌握各种排序方法的时间复杂度的分析方法。能从“关键字间的比较次数”分析排序算法的平均情况和最坏情况的时间性能。 按平均时间复杂度划分,内部排序可分为三类:O(n2)的简单排序方法,O(nlogn)的高效排序方法 和 O(dn)的基数排序方法。 3.理解排序方法“稳定”或“不稳定”的含义,弄清楚在什么情况下要求应用的排序方法必须是稳定的。 4. 了解外部排序的基本过程及其时间分析。 人有了知识,就会具备各种分析能力, 明辨是非的能力。 所以我们要勤恳读书,广泛阅读, 古人说“书中自有黄金屋。 ”通过阅读科技书籍,我们能丰富知识, 培养逻辑思维能力; 通过阅读文学作品,我们能提高文学鉴赏水平, 培养文学情趣; 通过阅读报刊,我们能增长见识,扩大自己的知识面。 有许多书籍还能培养我们的道德情操, 给我们巨大的精神力量, 鼓舞我们前进。 * * void Merge (RcdType SR[], RcdType TR[], int i, int m, int n) { // 将有序的记录序列 SR[i..m] 和 SR[m+1..n] // 归并为有序的记录序列 TR[i..n] } // Merge for (j=m+1, k=i; i=m j=n; ++k) { // 将SR中记录由小到大地并入TR if (SR[i].key=SR[j].key) TR[k] = SR[i++]; else TR[k] = SR[j++]; } … … if (i=m) TR[
文档评论(0)