计算机组成chap09.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机组成chap09

计算机组成与体系结构第9章并行体系结构2第9章并行体系结构9.1计算机体系结构的并行性9.2计算机体系结构的分类9.3阵列处理机和向量处理机9.4互连网络9.5多处理机系统UMA对称多处理器系统NUMA对称多处理器SunT1多处理器9.6多计算机系统MPP机群9.7网格9.8并行处理面临的挑战计算机组成与体系结构第9章并行体系结构9.1计算机体系结构的并行性49.1计算机体系结构的并行性并行性:计算机系统具有可以同时进行运算或操作的性能,包括同时性:同一时刻并发性:同一时间间隔实现并行机制的途径:时间重叠:时间并行资源重复:空间并行时间重叠+资源重复资源共享:分时系统、共享存储器、…是一种软件方法,使多个任务按一定时间顺序轮流使用同一套硬件设备。降低成本,提高计算机设备的利用率。59.1计算机体系结构的并行性并行机制的层次:网格多计算机多处理器协处理器片内并行紧耦合松耦合系统级并行处理器级并行指令级并行69.1计算机体系结构的并行性紧耦合系统(直接耦合系统) 计算机间物理连接的频带较高,一般通过总线或高速开关实现计算机间的互连,可共享主存。松耦合系统(间接耦合系统) 通过通道或通信线路实现计算机间的互连,可共享外存设备(磁盘、磁带等)。 两种形式:多台计算机和共享外存设备连接计算机网,通过通信线路连接79.1计算机体系结构的并行性并行机制的层次:片内并行指令级并行芯片多线程单片多处理器(多核CPU)协处理器: 图形、数学、IOP、网络、媒体、加密、…多处理器多计算机网格:非常大的、国际间的、松散耦合的、异构的机群。89.1计算机体系结构的并行性多处理器系统多计算机系统计算机组成与体系结构第9章并行体系结构9.2计算机体系结构的分类109.2计算机体系结构的分类计算机分类?冯·诺依曼机计算机体系结构SISDSIMDMISDMIMD向量处理机阵列处理机多处理器多计算机交换结构CC-NUMAMPPNC-NUMA总线网格超立方体COWNUMACOMAUMA消息传递共享内存Flynn分类法计算机组成与体系结构第9章并行体系结构9.3阵列处理机和向量处理机129.3阵列处理机和向量处理机阵列处理机:又称并行处理机,主要技术手段是硬件上采用资源重复的方法实现并行性。也称为SIMD计算机。 SIMD计算机:多个PU按一定方式互连,在同一个CU控制下,对各自的数据完成同一条指令规定的操作;从CU看指令顺序执行,从PU看数据并行执行。一、阵列处理机(ArrayProcessor)CUPU1CSMM1DS1ISMM2MMm……PU2DS2PUnDSn……SM139.3阵列处理机和向量处理机SIMD计算机的操作模型一、阵列处理机(ArrayProcessor)控制部件(CU)P0M0P1M1P2M2PN-1MN-1……互连网络…………PE0PE1PE2PEN-1运算 处理器存储器处理单元149.3阵列处理机和向量处理机一、阵列处理机(ArrayProcessor)阵列控制 部件处理单元PE1……数据寻径网络本地存储器LM1处理单元PE2本地存储器LM2处理单元PE2本地存储器LM2控制存储器 (程序和数据)主机大容量存储器标量处理机标量指令指令网络控制向量指令广播总线I/O (用户)分布式存储器的阵列机159.3阵列处理机和向量处理机一、阵列处理机(ArrayProcessor)对准网络SM1SM2SMm……PE1PE2PEn……控制存储器阵列控制部件标量处理机主机大容量 存储器I/O (用户)标量指令网络 控制数据总线广播总线(向量指令)共享的多体 并行存储器共享存储器 的阵列机169.3阵列处理机和向量处理机二、向量处理机(VectorProcessor)标量:单个量向量:一组标量 数组A=(a1,a2,a3,…,an)例:典型向量求解问题 Y=a×X+Y 其中,a为标量; X、Y为向量,初始值放在存储器中。179.3阵列处理机和向量处理机【例】用标量处理机来计算Y=a×X+Y假定X、Y向量首元素地址在寄存器Rx、Ry中;向量元素个数为64,每元素为64bit。 LD F0,a ;标量a装入寄存器F0 ADD R4,Rx,#512 ;向量元素的末地址装入寄存器R4LOOP:LD F2,M(Rx) ;取向量元素X(i) MUL F2,F0,F2 ;a与X(i)相乘 LD F4,M(Ry) ;取向量元素Y(i) ADD F4,F2,F4 ;aX(i)与Y(i)相加 SD M(Ry),F4 ;存储结果向量元素 ADD Rx,Rx,#8 ;X向量元素下标加1 ADD Ry,Ry,#8 ;Y向量元素下标加1 SUB R20,R4,Rx ;(R4)-(Rx)→R20,计算是否到界 BNZ R20,LOOP ;若循环未结束,转

文档评论(0)

33894522 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档