- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2001.9.1 计算机系统结构 * 每个PUi的组成 2001.9.1 计算机系统结构 * 8.4 SIMD的典型算法(P483) 8.4.1 矩阵加、减(P484) 2001.9.1 计算机系统结构 * 8.4.2 迭代平均(P483) 在工程数学中,经常需要求解场方程,其常用方程是拉普拉斯方程(式8.8)。用数字计算机求解该方程需要先将其差分化(步长为h),差分结果为式8.10,这是一个典型的中值公式,每一轮迭代中要对所有结点进行一次上述计算。当进行到所有结点第K轮值与第K+1轮值足够接近时,就认为得到了方程的数字解答。在SISD计算机上做每一轮迭代要求64个元素都按上述公式计算,共64次;在SIMD计算机上各单元可按上述公式并行计算,速度是前者的64倍。并行计算过程如下: 每一轮迭代中各结点的基本操作(参看教材P479程序8.1): 1.累加器清零; 2.现有数据同时北传; 3.累加器加上南来数据; 4.现有数据同时东传; 5.累加器加上北来数据; 6.现有数据同时南传; 7.累加器加上北来数据; 8.现有数据同时西传; 9.累加器加上东来数据; 10.累加器除以4,得新数据; 11.若新数据与现有数据之差大于允差,则以新数据替换现有数据,转1,否则结束。 2001.9.1 计算机系统结构 * 2001.9.1 计算机系统结构 * 8.4.3 非数组问题的向量化算法(P486) 2001.9.1 计算机系统结构 * 本章小结 (1) SIMD的5个组成部分 (2) SIMD的两种结构类型 (3) SIMD的代表实例 ─── ILLIAC IV (4) SIMD的典型算法。 习题:P498,题12。 2001.9.1 计算机系统结构 * 第九、十章 MIMD计算机(P499) MIMD计算机与SIMD计算机的主要区别,在于SIMD只能在同一时刻做多件相同的事情,而MIMD却可以在同一时刻做多件相同或不同的事情(多指令流所致),所以求解同一个问题时采用MIMD将能实现更大比例的并行操作,即处理效率更高。 从并行处理的级别看,SIMD是数据级并行处理,流水线是指令级并行处理,MIMD是任务级并行处理。 由于技术上的原因,目前实现的MIMD计算机都是多处理机系统,包括多计算机系统。 多处理机系统由多台处理机连接而成,它们能够并行执行独立的程序模块,并且相互通信和同步,以实现作业、任务级的并行。 2001.9.1 计算机系统结构 * 9.1 MIMD的典型结构(P500) 多处理机系统通常包含多个处理机模块、多个存储器模块、多个I/O通道,这些设备与单处理机系统中的设备没有本质不同,最大的差别是互连网络和多机操作系统。 由于多处理机系统是在作业、任务级并行,处理机之间的通信不像SIMD系统那样频繁和急迫,所以互连网络可以采用通用网实现,以便在满足流量需要的前提下降低成本。 (1)共享存储器方案 P500图9.1(a) (2)分布存储器方案 P500图9.1(b) 2001.9.1 计算机系统结构 * (1)任务派生语句 ─── 当前运行的进程向操作系统申请创建一个新进程,并试图用一个空闲处理机来运行它。如果操作系统没有找到空闲处理机资源,则让新进程排队等待。 格式: FORK 进程名 (2)任务汇合语句 ─── 检查包括当前进程在内的各先期并发进程是否完成,如未完成则停止当前进程,释放其处理机资源,如已完成则让当前进程继续执行,通常是转入后继进程。汇合语句的每次执行会对一个计数器加1(该计数器初值为0),直至达到语句所要求的汇合进程数。 格式:JOIN 汇合进程数,计数器序号 9.2 MIMD的并行程序控制(P608) 2001.9.1 计算机系统结构 * 实例:x = ( a + b )×( a - c ) 我们设想用3个进程来完成上式中3个运算,则它们之间的相关关系可用数据相关图来描述(右图)。 并行程序可用Fork/Join语句写成如下形式: k: Fork k+3 k+1: Add A,B,T1 k+2: Goto k+4 k+3: Sub A,C,T2 k+4: Join 2,1 k+5: Mul T1,T2,X 该程序在2台处理机的MIMD系统上运行的时空关系可用资源时间图表示(假设进程k执行时间大于进程k+3)。 2001.9.1 计算机系统结构 * 9.3 MIMD的加速性能模型(P502~P512) (1)两个处理机的并行模型(P504); 总处理时间 = R×max{ M-K,K } + C×( M-K )×K 其中: M ── 任务总数; K ── 分配给
文档评论(0)