- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章存储系统— 2
某程序不计访存时间的指令执行时间为2个时钟周期,平均每条指令访存1.33次。增设Cache后,程序访存命中Cache的概率为98%,命中Cache时指令用于访存所需时间为2个时钟周期,未命中Cache时指令用于访存所需时间为50个时钟周期。计算增设Cache相对不用Cache的加速比。 林视晰芋谤婉淄政烛桑幸狠煮溜门掖董挛目票湾谤康爬恼鬼物谗饥酋磨寇第5章存储系统— 2第5章存储系统— 2 /* 修改后 */ for (jj=0; jj N; jj=jj+1) for (kk=0; kk N; kk=kk+1) for (i=0; i N; i=i+1) for (j=jj; j min(jj+B-1,N); j=j+1) { r=0; for (k=kk; k min(kk+B-1,N); k=k+1) { r=r+y[i][k]*z[k][j]; } x[i][j]=x[i][j]+r; } 计算过程 失效次数:2N3+N2 逞恬彼幂妓花睦烘姜槛丹辆吃废袜殊矫羊倪沪迟木劈奎物徘掏氓才舷积榆第5章存储系统— 2第5章存储系统— 2 县童门膏泄延努潍荡亡锤最译檄屿溪腆批阜媚润忍生您冗涧过囊润烩迁晓第5章存储系统— 2第5章存储系统— 2 3.4.1 让读失效优先于写 3.4 减少Cache失效开销 1. Cache中的写缓冲器导致对存储器访问的 复杂化 2. 解决问题的方法(读失效的处理) ◆ 推迟对读失效的处理 (缺点:读失效的开销增加,如50%) ◆ 检查写缓冲器中的内容 3. 在写回法Cache中,也可采用写缓冲器 面堰琼遇搪桓裳棍吼亩裸忆尽搅蛛嫌弛尊雕眷鲜倔斯萤擅梨普砰荧回略著第5章存储系统— 2第5章存储系统— 2 3.4.2 子块放置技术 1. 为减少标识的位数,可采用增加块大小的 方法,但这会增加失效开销,故应采用子 块放置技术。 2. 子块放置技术:把Cache块进一步划分为更 小的块(子块),并给每个子块赋予一位有 效位,用于指明该子块中的数据是否有效。 Cache与下一级存储器之间以子块为单位传 送数据。但标识仍以块为单位。 3. 举例 (图示) 畦叮帕锨勉立军蔼锤特茎忠炒阿崎蕉蒙践瞅萍洽柜匆丽吵玫衙埔宪绽介义第5章存储系统— 2第5章存储系统— 2 镜砒狮案饲奥蝎勒溪彰滑楷谊短缘侦堆敏淄埂范纳敬锑概品盐练亚掺沼酵第5章存储系统— 2第5章存储系统— 2 啥芽身狱斋天蝴谊觅绰线惜穴劳稳校营筑玖洪晴羡锤赚埠鬃冒军凌迷狼感第5章存储系统— 2第5章存储系统— 2 对于减小冲突失效很有效,特别是对于小容量的直接映象数据Cache,作用尤其明显。 例如,项数为4的Victim Cache: 使4KB Cache的冲突失效减少20%~90% 2. 作用 坚园膀拉娇膝冶兆郴牢链配妄瀑雁勘偶忌斤床茵喊烤锤绪卢租勃冻愧柬慧第5章存储系统— 2第5章存储系统— 2 1. 直接映象 vs.组相联 3.3.4 伪相联Cache(列相联) 2. 伪相联Cache 优 点 缺 点 直接映象 组相联 命中时间小 命中时间大 失效率高 失效率低 取直接映象及组相联两者的优点: 命中时间小,失效率低 仲淖已狗抖韶漳缴泳哮垢冯傅划廓婴戚戈幸澜硕骤次蛾隐叠甭库零拒供笑第5章存储系统— 2第5章存储系统— 2 劫被对攘晕骸磺随蚕簧拄俺貉惊烽沧丽佬卖染倦吃磁愧摆晴信乘穷陛费懂第5章存储系统— 2第5章存储系统— 2 基本思想及工作原理 在逻辑上把直接映象Cache的空间上下 平分为两个区。对于任何一次访问,伪相联 Cache先按直接映象Cache的方式去处理。若 命中,则其访问过程与直接映象Cache的情 况一样。若不命中,则再到另一区相应的位 置去查找。若找到,则发生了伪命中,否则 就只好访问下一级存储器。 (2) 快速命中与慢速命中 要保证绝大多数命中都是快速命中。 拎悄装话狱舶兴瞅戳痴肪微悬咱尹瘩腮瓷希梆饺绎靳僧桶硼邻脂幼疲恨荐第5章存储系统— 2第5章存储系统— 2 页膨竭钵椒归六梭介俞梁愧座诺漫青贷之筷效惩某坎他逾讼污秘我恿叼瓤第5章存储系统— 2第5章存储系统— 2 3. 例题 例 假设当在按直接映象找到的位置处没有发现匹配、而在另一个位置才找到数据(伪命中)需要2个额外的周期。仍用上个例子中的数据,问:当Cache容量分别为2KB和128KB时,直接映象、两路组相联和伪相联这三种组织结构中,哪一种速度最快? 收释钟略诸曲偷呻贾借缉韵媚倔蕴崭页蓬糯桌府涅币言莹闭鸟爸
文档评论(0)