- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分 块 本章内容 Cache存储系统Cache性能提高Cache性能降低缺失率编译优化 /* Before */ for (i = 0; i N; i = i+1) for (j = 0; j N; j = j+1) { r = 0; for (k = 0; k N; k = k+1) r = r + y[i][k]*z[k][j]; x[i][j] = r; } X[] i j Y[] i k Z[] k j Newer accesses Older accesses i循环一次,要读取矩阵z的所有N×N个元素,对矩阵y一行中的N个元素进行重复访问,对矩阵x一行中的N个元素进行写操作。 3 之 2 分 块 /* After */ for (jj = 0; jj N; jj = jj+B) for (kk = 0; kk N; kk = kk+B) for (i = 0; i N; i = i+1) for (j = jj; j min(jj+B-1,N); j = j+1) { r = 0; for (k = kk; k min(kk+B-1,N); k = k+1) r = r + y[i][k]*z[k][j]; x[i][j] = x[i][j] + r; } B为分块因子,B×B子矩阵都在Cache中。本技术是通过提高空间和时间局部性来减少缺失。 本章内容 Cache存储系统Cache性能提高Cache性能降低缺失率编译优化 3 之 3 通过并行性降低缺失代价/缺失率 本章内容 Cache存储系统Cache性能提高Cache性能 用非阻塞Cache减少Cache缺失暂停 指令和数据硬件预取 编译控制的预取 指令和数据硬件预取 本章内容 Cache存储系统Cache性能提高Cache性能通过并行性降低缺失代价/缺失率 思想 在处理器访问指令和数据之前就将它们预取到Cache或预取到可以比主存访问速度更快的外部缓冲区中。 提示 预取技术依赖于存储器带宽,编译器可以帮助减少不必要的预取。 2 之 1 例:指令硬件预取 本章内容 Cache存储系统Cache性能提高Cache性能通过并行性降低缺失代价/缺失率 例子 AXP21064微处理器在缺失时取两个块:被请求的块和其后紧挨着的块。被请求的块装入到指令Cache中,而预取的块被装入到指令流缓冲区中。如果某次被请求块在指令流缓冲区中找到,则原Cache请求被取消,块被从流缓冲区中读入,然后下一个预取请求被发出。 性能 Jouppi[1990]研究发现:对于容量为4KB、块大小为16B的直接映象指令Cache来说,大小为1块的指令流缓冲区可以捕捉到15%~25%的缺失;大小为4块的指令流缓冲区,命中率提高到大约50%,大小为16块提高到72%。 2 之 2 编译控制的预取 本章内容 Cache存储系统Cache性能提高Cache性能通过并行性降低缺失代价/缺失率 思想 利用编译器来插入预取指令,提前发出数据请求,可以将数据预取到寄存器(寄存器预取,例如:HP PA-RISC)或将数据预取到Cache(Cache预取,例如:MIPS IV、PowerPC、SPARC v.9)。 提示 循环是重要的目标;而且生成预取指令需要时间,必须注意这些开销不能超过收益。 降低Cache命中时间 本章内容 Cache存储系统Cache性能提高Cache性能 小而简单的Cache 在Cache索引过程中避免地址变换 流水Cache存取 跟踪Cache 三级存储系统 本章内容 存储系统的组织方式: 两个存储系统的组织方式 一个存储系统的组织方式 全Cache存储系统 两个存储系统的组织方式 本章内容三级存储系统 有“Cache-主存”和“主存-磁盘”两个独立的存储系统,这种结构也称为物理地址Cache存储系统。目前的大部分处理机均采用这种两级存储系统。 CPU 虚拟地址 MMU Cache 主存储器 主存物 理地址 数据或指令 CPU 虚拟地址 MMU Cache 主存储器 数据或指令 主存物理地址 存储管理部件 一个存储系统的组织方式 本章内容三级存储系统 将Cache、主存和磁盘组织在一起构成一个“Cache-主存-磁盘”存储系统,这种结构也称为虚拟地址Cache存储系统。如Intel公司
您可能关注的文档
最近下载
- 热电联产管理办法.PDF VIP
- 《比和比例》单元测试卷及答案,推荐文档 .pdf VIP
- 云南省爱我国防知识网络竞赛活动小学初中高中中职大学组题库及答案.doc VIP
- 四年级上册语文 类文阅读小纸条.pdf VIP
- dsc3称重式降水传感器用户手册.doc VIP
- 集电线路跨越35kV、10kV及国道工程专项施工方案.docx VIP
- 跨越35kV、10kV线路施工方案.docx VIP
- 八年级物理上学期实验专题.doc VIP
- 第一单元第1课+了解互联网+课件2024—2025学年西安交大版(2024)初中信息技术七年级上册.pptx VIP
- 《水利水电工程单元工程施工质量验收评定标准-地基处理与基础工程》(SL 633-2012).pdf VIP
文档评论(0)