并行计算机体系结构第5章.pptVIP

  1. 1、本文档共191页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
并行计算机体系结构第5章

并行存储系统和同步机制;层次存储系统;层次存储系统; 在一般计算机系统中,有两种存储系统: Cache存储系统:由Cache和主存储器构成 主要目的:提高存储器速度,解决主存速度不足;虚拟存储系统:由主存储器和硬盘构成 主要目的:扩大存储器容量,解决主存容量不足;存储系统的容量 要求: 提供尽可能大的地址空间 能够随机访问 方法有两种: 只对系统中存储容量最大的那个存储器进行编址,其他存储器只在内部编址或不编址 Cache存储系统 另外设计一个容量很大的逻辑地址空间,把相关存储器都映射这个地址空间中 虚拟存储系统;存储系统的价格 计算公式: 当S2》S1时,C≈C2 S2与S1不能相差太大;存储系统的速度 表示方法:访问周期、存取周期、存储周期、存取时间等 命中率定义:在M1存储器中访问到的概率 其中:N1是对M1存储器的访问次数 N2是对M2存储器的访问次数 访问周期与命中率的关系: T=HT1+(1-H)T2 当命中率H→1时,T→T1;存储系统的访问效率: 访问效率主要与命中率和两级存储器的速度之比有关 例3.1:假设T2=5T1,在命中率H为0.9和0.99两种情况下,分别计算存储系统的访问效率。 解:;提高存储系统速度的两条途径: 一是提高命中率H, 二是两个存储器的速度不要相差太大 其中:第二条有时做不到(如虚拟存储器),这时,只能依靠提高命中率 例3.2:在虚拟存储系统中,两个存储器的速度相差特别悬殊,例如:T2=105 T1。如果要使访问效率到达e=0.9,问需要有多高的命中率?;解:; 计算公式: 其中:H’是采用预取技术之后的命中率 H是原来的命中率 n为数据块大小与数据重复使用次数的乘积;解:n=4×5=20, 采用预取技术之后,命中率提高到:; 证明方法一: 采用预取技术之后, 不命中率(1-H)降低n倍:; 证明方法二: 在原有命中率的计算公式中,把访问次数扩大到n倍。由于采用了预取技术,命中次数为:nN1+(n-1)N2,不命中次数仍为N2,因此新的命中率为:;存储系统的层次结构;存储层次的四个问题;多体并行,多套地址寄存器和控制逻辑 1. 高位交叉访问存储器 主要目的:扩???存储器容量 实现方法:用地址码的高位部分区分存储体号 要求每个模块都有各自独立的控制部件,每个模块均可独立工作。但系统地址的连续空间落在同一存储体内,容易发生访存冲突。并行存取的可能性很小。; 高位交叉访问存储器结构框图;例3.4:用4M字×4位的存储芯片组成16M×32位的主存储器。共用存储芯片: 用最高2位地址经译码后产生的信号,控制各组存储芯片CS。 每组中的32根数据线分别对应直接相连,称为“线或”方式。;低位交叉访问存储器 主要目的:提高存储器访问速度 实现方法:用地址码的低位部分区分存储体号 要求每个模块都有各自独立的控制部件,每个模块均可独立工作。系统地址在一个存储体内部是不连续的,对连续地址的访问分布在不同的存储体中,可避免存储体访问冲突。 理想情况下,即一个模m的多体交叉访问存储器在不发生分体冲突时的频宽是单体存储器频宽的m倍。 ;低位交叉访问存储器结构框图; 地址编码方法: 由8个存储体构成的低位交叉编址方式; n个存储体分时启动 一种采用流水线方式工作的并行存储器 每存储体的启动间隔为:t= 其中: Tm为每个存储体的访问周期, n为存储体个数。;访问冲突 共有n个存储体,每个存储周期只能取到k个有效字,其余n-k个存储体有冲突。 假设p(k)是k的概率密度函数,即p(1)是k=1的概率,p(2)是k=2的概率,…,p(n)是k=n的概率。k的平均值为: N是每个存储周期能够访问到的平均有效字的个数。 通常把 N称为并行存储器的加速比。;定义转移概率为g,即读出的是转移指令,且转移成功的概率。这时有: p(1)=g p(2)=(1-p(1))g=(1-g)g p(3)=(1-p(1)-p(2))g=(1-g)2g …… p(k)=(1-g)k-1g (k=1,2,…,n-1) …… p(n)=(1-g)n-1; ;无冲突访问存储器; 具体方法: 存储体的个数取质数。 原因:变址位移量必然与存储体个数互质 设地址间距为d=1,m体交叉存储器的工作体数为m’=m/(m,d),其中(m,d)为m和d的最大公约数。当m’=T/ζ时,必将引起流水线断流,所以m取为质数。;2. 二维数组的无冲突访问存储器 要求:一个n×n的二维数组,按行、列、对角线和反对角线访问,并且在不同的变址位移量情

您可能关注的文档

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档