- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
12计算机系统结构(第12讲)
计算机系统结构(第十二讲);第八章 SIMD计算机;8.4 SIMD计算机的应用;8.4.1 数值应用问题的特征;大型数值应用问题一般都是高度结构化的计算问题
必须提高系统结构的并行性,并且要充分研究这类问题的特点
;1、大型数值问题的分类;2、适合于连续模型的SIMD系统结构;(1)、阵列结构;;一维问题:
;可用阵列处理机求解上述形式的方程组,每个格点有一台处理机,每台处理机与其四邻直接相连
由于所有的处理机执行同样的迭代,只要一个指令流就可以控制所有处理机
程序8.1:阵列处理机上求解泊松问题的主迭代;;Vi,j;回顾连续模型机器发展的历史,从中可以得到如下一些重要的结论:
①、②、③、④、⑤ P480 ;(2)、多立方体结构;3、数据流需求;;;图8.18:解决连续模型泊松方程问题的网格
图8.19:扇出系数为2的逻辑网络
一个用于N项数据排序的网络至少有log2N个逻辑层;;;8.4.2 算法举例;1、有限差分问题;2、矩阵加;;3、矩阵乘;;图8.22:矩阵乘存储器分配举例
注:这里只用到8个处理单元(PEM0~PEM7)
亦可以把Illiac Ⅳ的64个处理单元全部利用起来并行运算,即将K循环的运算也改为并行,则可进一步提高速度;需要累加和;;4、累加和;具体步骤如下
第一步 ~ 第十二步 P486-P487
图8.23:并行处理机上累加和计算过程示意图
速度提高了N/log2N
;;第一次计算:
A(0)+A(1)
A(1)+A(2)
A(2)+A(3)
A(3)+A(4)
A(4)+A(5)
A(5)+A(6)
A(6)+A(7)
;第二次计算:
A(0)+[A(1)+A(2)]
[A(0)+A(1)]+[A(2)+A(3)]
[A(1)+A(2)]+[A(3)+A(4)]
[A(2)+A(3)]+[A(4)+A(5)]
[A(3)+A(4)]+[A(5)+A(6)]
[A(4)+A(5)]+[A(6)+A(7)]
;第三次计算:
A(0)+[A(1)+A(2)+A(3)+A(4)]
[A(0)+A(1)]+[A(2)+A(3)+A(4)+A(5)]
[A(0)+A(1)+A(2)]+[A(3)+A(4)+A(5)+A(6)]
[A(0)+A(1)+A(2)+A(3)]+[A(4)+A(5)+A(6)+A(7)]
;5、递归技术;;图8.24(a)中:(0,7)=(0,0)+(1,1)+(2,2)+(3,3)+(4,4)+(5,5)+(6,6)+(7,7)
图8.24(b)中:
(0,i)=(0,0)+……+(i,i) i=0,1,……,7
;乘法递归:
Xi=ai*Xi-1 i0
X0=a0
可以用图8.24来实现上述乘法递归问题
还可以用8.24来实现其他具有结合规律的问题
(1)~(5) P489
对于如下问题
Xi=ai*Xi-1+bi
如令Xi = [ Xi , 1]t
则有: Xi=Ai*Xi-1
;对于以下问题:
xi=ai*xi-1+bi*Xi-2
如令Xi = [ xi , xi-1]t
则有: Xi=Ai*Xi-1
泊松方程:
xi-1 -2xi + xi+1 = -bi
可以用以下方程组表示:
AX=b
其中,A为三对角线方程组
;6、递归加倍法与循环归约法;
;方法二:循环归约
xi-2 -2xi-1 + xi = -bi-1
xi-1 -2xi + xi+1 = -bi
xi -2xi+1 + xi+2 = -bi+1
上述方程合并可以得到:
xi-2 -2xi + xi+2 = - (bi-1 +2bi +bi+1)
上述过程重复进行,每次从方程组中去掉大约一半的方程,直到最后留下一个可直接求解的方程
;结论:
(1)、一些看起来只能串行地计算的问题可以用并行计算法解决,并有比较好的加速比
(2)、一个用于求解全信息问题的好的并行算法每次迭代应使每个变量的影响范围扩大一倍
(3)、能支持影响范围成倍扩大的通信方式是在一系列迭代过程中处理单元能依次和与之相距1、2、4……的处理单元通信;8.5 连续模型的结构向何处发展;连续模型是并行处理机的一种很自然的模型,按近邻互连方式连接的处理机可以模拟近邻相互作用
设计系统结构时有以下几种选择:
(1)、设计一种非常专用的近邻互连的机器,它处理连续模型的某些问题非常高速且非常有效
(2)、设计一种较通用的机器,它处理连续模型的??题仍有
文档评论(0)