高等计算机系统结构.ppt

  1. 1、本文档共108页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高等计算机系统结构

高等计算机系统结构 清华大学计算机科学与技术系高性能计算研究所 郑纬民 教授 2007年11月 高等计算机系统结构 第一章 高等计算机的核心技术——并行处理 第二章 加速比性能模型与可扩展性分析 第三章 互连与通信 第四章 划分与调度 第五章 并行存储器系统 第六章 Cache Coherence 第七章 Memory Consistency 第八章 指令级并行处理 如果C2读miss,这时C1中有Dirty的副本,则把它写回memory,内存再给C2一个副本,变成Valid。 如果C1写命中,它告诉memory控制器,控制器发无效命令给在D1的当前向量中有记录的所有Cache。 5. 三种目录 全映射(full map)目录:存放与全局存储器中每个块有关的数据。系统中的每个Cache可以同时存储任何数据块的副本,即每个目录项包含N个指针(N是处理机数目)。 有限(limited)目录:每个目录项有固定数目的指针(小于N)。 链式(chained)目录:将目录分布到各个Cache(其余同全映射目录)。 6.2.2 全映射目录 1.目录项结构 目录项中有N个处理机位(对应N台处理机)和一个重写位,如下图所示: 目录项: 重写位(1位) 处理机位(N位) 处理机位表示相应处理机的Cache block的状态(存在或不存在)。 有一个也只有一个处理机位为“1”,那么该处理机可以对该块进行写操作。 Cache的每个块有两个状态位: 有效位 有效块是否允许写 有效 1位 Cache的状态位应该和目录项的状态一致。 1位 允许写 目录项: 重写位(1位) 处理机位(N位) Cache状态位: 2.目录的三种情况 我们来看三台处理机(三个Cache)的例子。 (1)C1,C2,C3都没有单元X的副本 Shared Memory x: c 0 0 0 data C1 P1 C2 P2 C3 P3 (2)C1,C2,C3同时请求X单元的副本,这时目录项中的三个指针(处理机位)被置一,表示这些Cache中已有数据副本。 目录项的重写位被置为未写(c)状态,表示无一处理机允许写入该数据块。 Shared Memory x: c 1 1 1 data x: P1 x: P2 x: P3 C1 C2 C3 (3)C3请求对该块的写允许权时出现第(3)种情形,重写被置成D状态,且有一个指针指向C3的数据块。 Shared Memory x: D 0 0 1 data P1 P2 x: P3 C1 C2 C3 data 3.第二种情况?第三种情况的过程 P3向C3发出写请求时: (1)C3检测出包含单元X的块是有效的,但Cache中的块允许位状态表示不允许处理机对该块进行写操作。 (2)C3向包含单元X的存储器模块发出写请求,并暂停P3工作。 (3)该存储器模块发出一个无效请求给C1和C2(根据目录项的内容发几个无效信号) (4)C1和C2收到无效请求后,把相应位置1,表示含单元X的块已无效,并发送一个回答信号给请求的存储器模块。 (5)存储器模块收到回答信号后,将重写位置1,清除指向C1、C2的指针,发出允许信号给C3。 (6)C3收到写允许信号后,修改Cache的状态并激活处理机P3。 4. 目录所占空间 假设存储器大小和处理机台数N成正比,即台数增加时,存储器的模块数也增加,所以数据块的个数也和N成正比。 另外目录项的大小也和处理机台数N成正比,所以目录的总所占空间和N2成正比。 即: 目录项数*项大小 = O ( N2) 太大不便于扩展。 6.2.3 有限目录 解决目录过大的问题。 任意一个数据块在Cache中同时存在的副本数量有一定限制,那么目录大小的增加不会超过一个常数。 符号表示法: DiriX i:指针的数量。 X是NB,表示没有广播功能的方案。 DirNNB表示没有广播功能的全映射方式 DiriNB(i〈 N):使用i个指针的没有广播功能的有限目录协议方式。 除了多于i个Cache请求读一个特定的数据块的情况外,有限目录协议与全映射协议类似。 有限目录中指针不是每台处理机一位,而是针对处理机的二进制标识符进行编码,所以指针占log2N位存储器。 在全映射方式中,每个处理机对应一个指针,所以N台处理机一共用了N位,而有限目录中只用log2N位,设N =16,则log216 = 4。 如果允许两个指针,则需要8位。 所以目录的存储容量为O(Nlog2N),比全映

文档评论(0)

ailuojue2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档