适合于数字信号处理的-并行处理算法和结构.ppt

适合于数字信号处理的-并行处理算法和结构.ppt

高性能计算机的

体系结构与程序优化;提纲;体系结构的位置;体系结构的主要研究内容;三种类型的体系结构技术;结点内并行:超长指令字结构;结点内并行:同时多线程结构;结点内并行

超标量、动态调度、猜测执行;结点间并行:消息传递系统;结点间并行:共享存储系统;结点间并行:COMA;存储器的供数率跟得上吗?;性能不仅依赖于结构;充分利用处理器内的并行;发挥CPU内并行性的主要手段;假设:取数时间较长,后续指令不能立即使用

源程序语句:a=b+c; d=e-f;

a,b,c,d,e,f都在存储器中.

Slowcode:

LW Rb,b

LW Rc,c

ADD Ra,Rb,Rc

SW a,Ra

LW Re,e

LW Rf,f

SUB Rd,Re,Rf

SW d,Rd;应用程序员可以做什么?;循环展开的例子;运算顺序的调整;运算顺序的调整;运算顺序的调整;更一般的形式;存储器的层次结构;存储层次发挥作用的基本原理;寄存器的使用;寄存器的使用;寄存器的使用;寄存器的使用;高速缓冲存储器(cache);Cache中块的放置策略;Cache不命中的三个原因(3C);调整程序以提高cache命中率;数组合并的例子;循环交换的例子;循环合并的例子;分块的例子;分块的例子;减少因分块导致的冲突不命中;分块的性能提高;多

文档评论(0)

1亿VIP精品文档

相关文档