web,信息检索pcchap2
Chapter 2Parallel Programming Platforms Limitation of memory system performance 程序执行的效率不仅依赖于processor 的速度,也依赖内存的速度 A memory system consists of DRAM and multiple levels of catches. Example 2.2 CPU 1 GHz(109), two add units and can execute four instructions in each cycle, add time = 4 G Dram access time 100 ns (= 100 cycles), processor must wait 100 ns before it can process the data A?B= a1b1+a2b2+,…,+anbn, 实际每次取数需100ns, 实际峰值为1G/100=100M ,大大低与运算峰值。解决方法是用catch把block的数据读到快速缓存中。 Strided access 在存储空间上交叉取数据 Dichotomy(二分法) of parallel computing platforms 按控制结构分 SIMD (single instruction, multiple
您可能关注的文档
最近下载
- 商业交房标准.pdf VIP
- 幼儿小班教学节气课件.ppt VIP
- 维保工程施工方案(3篇).docx VIP
- 2021-2022学年福州市连江县八年级上学期期中数学试卷(B卷)(含答案解析).docx VIP
- 《植物激素》(教案)-中职农林牧渔大类《植物生长和环境》同步教学(高教版)(第四版)(全一册).docx VIP
- 诊断学学习资料:西医诊断学总结.pdf VIP
- 幼儿小班教学节气.pptx VIP
- 《光合作用与呼吸作用的关系》(教案)-中职农林牧渔大类《植物生长和环境》同步教学(高教版)(第四版)(全一册).docx VIP
- 小学生入学行为规范课件.pptx VIP
- 马铃薯组培技术全流程.pdf VIP
原创力文档

文档评论(0)