高等計算機系統結構.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高等計算機系統結構

高等计算机系统结构 清华大学计算机科学与技术系高性能计算研究所 郑纬民 教授 2007年10月 计算机科学与技术系研究生课程 高等计算机系统结构 第一章 高等计算机的核心技术——并行处理 第二章 加速比性能模型与可扩展性分析 第三章 互连与通信 第四章 划分与调度 第五章 并行存储器系统 第六章 Cache Coherence 第七章 Memory Consistency 第八章 指令级并行处理 第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.3 存储器容量的规划 5.4 虚拟存储器技术 5.5 交叉访问的存储器 5.1 存储器系统的层次结构 存储器系统的层次结构如下图所示: CPU内的寄存器 高速缓存 主存储器 磁盘存储器 磁带机 层0:M0 层1:M1 层2:M2 层3:M3 层4:M4 容量和存取时间增加 每位成本增加 五个参数: 存取时间ti:从CPU到第i层存储器的往返时间 存储器容量Si:第i层的字节或字的数量 每字节成本Ci:第i层存储器的成本为CiSi 传输带宽bi:相邻层之间传送信息的速率 传输单位Xi:i和i+1层之间数据传送的粒度 对存储器系统中各层次存储器的特性,1993年的统计数据如下表: 存储器层次 特性 第0层 CPU寄存器 第1层 高速缓存 第2层 主存储器 第3层 磁盘存储器 第4层 磁带存储器 设备工艺 存取时间 容量(字节) 成本(美分/KB) 带宽(MB/S) 传送单位 分配管理 ECL SRAM DRAM 磁盘机 磁带机 10ns 25-40ns 60-100ns 10-20ms 2-20min 512B 128KB 512MB 60-228GB 512G-2TB 18000 72 5.6 0.23 0.01 400-800 250-400 80-133 3-5 0.18-0.23 字:4-8B 块:32B 页:0.5-1KB 文件:5-512KB 后援存储器 编译器分配 硬件控制 操作系统 操作系统/用户 操作系统/用户 第五章 并行存储器系统 5.1 存储器系统的层次结构 5.2 包含性、一致性和局部性 5.2.1 包含性 5.2.2 一致性 5.2.3 局部性 5.3 存储器容量的规划 5.4 虚拟存储器技术 5.5 交叉访问的存储器 5.2 包含性、一致性和局部性 5.2.1 包含性(inclusion) 1. 包含性的定义 M0? M1? M2?…… ? Mn 所有信息项最初存放在最外层Mn,在处理过程中,它的子集复制到Mn-1,同样, Mn-1的子集复制到Mn-2,…… 如果在Mi中找到一个信息字,那么同一个字的复制品在所有的高层Mi+1,Mi+2,……,Mn中都一定可以找到。 2. 相邻层之间的数据传送单位 CPU?高速缓存:字 高速缓存?主存储器:块(每块32个字节(8个字)) 主存?磁盘:页面(比如每页4K字节,包含128块) 磁盘?磁带:段 包含性可以用下面的图来说明: CPU寄存器 …… b a …… M1:高速缓存 a,b为高速缓存 块,32个字节 页面A a M2:主存储器 页面B b 页面A a M3:磁盘 存储器 页面B b 段F 段G 页面A a M4:磁带机 后援存储器 页面B b 段F 段G 字单位 块单位 页单位 段单位 5.2.2 一致性(coherence) 1.一致性定义 同一个信息项与后继存储器层次的副本是一致的。 如果在高速缓存中的一个字被修改过,那么在所有更高层上该字的副本也必须立即或最后加以修改 。 2.维护一致性的两种策略 (1)写直达(write-through,WT),即如果在Mi(i=1,2,…,n-1)中修改了一个字,则在Mi+1中需要立即修改。 (2)写回(write-back,WB),即如果在Mi+1 中的修改延迟到Mi中正在修改的字被替换时才进行。 5.2.3 局部性(locality) Hennessy和Patterson(1990年)提出了一条90-10规则:典型程序在10%的代码上可能要耗费其执行时间的90%(例如嵌套循环操作的最内层循环)。 时间局部性(temporal locality):最近的访问项(指令或数据)很可能在不久的将来再次被访问。即对最近使用区域的集中访问。 空间局部性(spatial locality):一个进程访问的各项的地址彼此很近,例如,表操作或数组操作含对地址空间中某一区域的集中访问。 顺序局部性(sequential locality):在典型程

文档评论(0)

zhaoxiaoj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档