- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章存储系统-2专用课件
某程序不计访存时间的指令执行时间为2个时钟周期,平均每条指令访存1.33次。增设Cache后,程序访存命中Cache的概率为98%,命中Cache时指令用于访存所需时间为2个时钟周期,未命中Cache时指令用于访存所需时间为50个时钟周期。计算增设Cache相对不用Cache的加速比。 /* 修改后 */ for (jj=0; jj N; jj=jj+1) for (kk=0; kk N; kk=kk+1) for (i=0; i N; i=i+1) for (j=jj; j min(jj+B-1,N); j=j+1) { r=0; for (k=kk; k min(kk+B-1,N); k=k+1) { r=r+y[i][k]*z[k][j]; } x[i][j]=x[i][j]+r; } 计算过程 失效次数:2N3+N2 对于减小冲突失效很有效,特别是对于小容量的直接映象数据Cache,作用尤其明显。 例如,项数为4的Victim Cache: 使4KB Cache的冲突失效减少20%~90% 2. 作用 1. 直接映象 vs.组相联 3.3.4 伪相联Cache(列相联) 2. 伪相联Cache 优 点 缺 点 直接映象 组相联 命中时间小 命中时间大 失效率高 失效率低 取直接映象及组相联两者的优点: 命中时间小,失效率低 基本思想及工作原理 在逻辑上把直接映象Cache的空间上下 平分为两个区。对于任何一次访问,伪相联 Cache先按直接映象Cache的方式去处理。若 命中,则其访问过程与直接映象Cache的情 况一样。若不命中,则再到另一区相应的位 置去查找。若找到,则发生了伪命中,否则 就只好访问下一级存储器。 (2) 快速命中与慢速命中 要保证绝大多数命中都是快速命中。 3. 例题 例 假设当在按直接映象找到的位置处没有发现匹配、而在另一个位置才找到数据(伪命中)需要2个额外的周期。仍用上个例子中的数据,问:当Cache容量分别为2KB和128KB时,直接映象、两路组相联和伪相联这三种组织结构中,哪一种速度最快? 首先考虑标准的平均访存时间公式: 平均访存时间伪相联 =命中时间伪相联+失效率伪相联×失效开销伪相联 解: 由于: 失效率伪相联=失效率2路 命中时间伪相联=命中时间1路+伪命中率伪相联×2; 伪命中率伪相联=命中率2路-命中率1路 =(1-失效率2路)-(1-失效率1路) =失效率1路-失效率2路 故: 平均访存时间伪相联 =命中时间1路+(失效率1路-失效率2路)×2 +失效率2路×失效开销1路 将表5-5中的数据代入上面的公式,得: 平均访存时间伪相联,2KB =1+(0.098-0.076)×2+(0.076×50) =4.844 平均访存时间伪相联,128KB =1+(0.010-0.007)×2+(0.007×50) =1.356 根据上例得到的访存时间表,对于2KB Cache,可得: 平均访存时间1路 =5.90 个时钟 平均访存时间2路 =4.90 个时钟 对于128KB的Cache有,可得: 平均访存时间1路 =1.50 个时钟 平均访存时间2路 =1.45 个时钟 可见,对于这两种Cache容量,伪相联Cache都是速度最快的。 缺点:多种命中时间 3.3.5 硬件预取技术 1. 指令和数据都可以预取 2. 预取内容既可放入Cache,也可放在 外缓冲器中 例如:指令流缓冲器 3. 预取效果 (1) Joppi的研究结果 ◆ 指令预取:(4KB,直接映象Cache, 块大小=16字节) 1个块的指令流缓冲器: 捕获15%~25% 的失效 4个块的指令流缓冲器: 捕获50% 16个块的指令流缓冲器:捕获72% ◆ 数据预取:(4KB,直接映象Cache) 1个数据流缓冲器:捕获25%的失效 还可以采用多个数据流缓冲器 (2) Palacharla和Kessler的研究结果 流缓冲器:既能预取指令又能预取数据 对于两个64KB四路组相联Cache来说: 8个流缓冲器能捕获50%~70%的失效。 4. 例
您可能关注的文档
最近下载
- 柑橘基地质量管理体系.pdf
- CAD2007入门教程_图文版.ppt VIP
- TSG Z7005—2015 特种设备无损检测机构 核准规则_可搜索.pdf VIP
- DB4419_T 24-2024 社区社会组织孵化服务指南.docx VIP
- 安全可靠分布式事务型数据库技术要求.pdf VIP
- SH3124-2001T 石油化工给水排水工艺流程设计图例.pdf VIP
- 电缆敷设图集 12D101-5.pdf VIP
- 《银行业法律法规与综合能力》课件.pptx VIP
- 2024新信息科技四年级《第二单元 用编码描绘世界》大单元整体教学设计.docx
- 淮北矿业2015年矿瓦斯综合治理“六项指标”考核办法淮北矿业2015年矿井瓦斯综合治理“六项指标”考核办法.doc VIP
文档评论(0)