- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多处理机new.ppt
计算机系统结构 第九章 多处理机 第七章 多处理机 多处理机定义: 两个或两个以上处理机(包括PU和CU),通过高速互连网络连接起来,在统一的操作系统管理下,实现指令以上级(任务级、作业级)并行。 按照Flynn分类法,多处理机系统属于MIMD计算机 研究多处理机的目的:提前10年得到性能高100倍的高性能计算机系统。 7.1 多处理机结构 2.分布式存储器多处理机 存储器分布在各个处理器上. 系统中每个结点包含了处理器,存储器,I/O以及互连网络接口. 存储器访问时间随存储单元的位置不同而变化.处理机访问本地存储器比较快,访问属于另一台处理机的远程存储器则比较慢,因为通过互连网络会产生附加的时间延迟。 支持较大数目的存储器 7.1.2 通信模型和存储器的结构模型 1.分布式共享存储器(DSM,Distributed Shared-Memory)或(SSM,Scalable Shared-Memory) 物理上分离的多个存储器可作为一个逻辑上共享的存储空间进行编址. 通信机制:可利用Load和Store指令中的地址隐含地进行数据通信. 2.多计算机(multicomputers) 整个地址空间由多个独立的地址空间构成,它们在逻辑上是独立的,远程的处理器不能对其直接寻址. 通信机制:消息传递方式. 7.1.3 通信机制的性能 通信机制中三个关键的性能指标: 通信带宽 通信延迟 通信延迟的隐藏 7.1.4 多处理机系统的特点 1、结构灵活 SIMD处理机:专用,PE数很多(几千个),固定有限的通信 多处理机: 通用,几十个, 高速灵活的通信 2、程序并行性 SIMD处理机的并行性存在于指令内部,识别比较容易。 多处理机的并行性存在于指令外部,在多个任务之间,识别难度较大。 一个简单的例子: Y = A+B*C*D/E+F。 用两个处理机: CPU1:B*C, A+F, A+B*C*D/E+F CPU2:D/E, B*C*D/E, 3、并行任务派生 SIMD阵列机把同种操作集中在一起,由指令直接启动各PE同时工作。 多处理机用专门的指令来表示并发关系,一个任务开始执行时能够派生出与它并行执行的另一些任务。 如果任务数多于处理机数,多余的任务进入排队器等待。 4、进程同步 SIMD阵列机仅一个CU,自然是同步的。 多处理机执行不同的指令,工作进度不会也不必保持相同。 先做完的要停下来等待。有数据相关和控制相关也要停下来等待。 要采取特殊的同步措施来保持程序所要求的正确顺序。 5、资源分配和进程调度 SIMD阵列机的PE是固定的,采用屏蔽手段改变实际参加操作的PE数目。 多处理机执行并发任务,需用处理机的数目不固定,各个处理机进入或退出任务的时刻不相同,所需共享资源的品种、数量又随时变化。 提出资源分配和进程调度问题,它对整个系统的效率有很大的影响。 7.2 多处理机的存储器体系结构 7.2.1集中式共享存储器体系结构 7.2.1.1 无冲突访问存储器 1. 二维数组的无冲突访问存储器 要求:一个n×n的二维数组,按行、列、对角线和反对角线访问,并且在不同的变址位移量情况下,都能实现无冲突访问。 顺序存储:按行、对角线访问没有冲突,但按列访问每次冲突 错位存储: 按行、按列访问无冲突, 但按对角线访问有冲突 2. n×n二维数组无冲突访问存储方案(一) ( P· Budnik 和 D· J· Kuck提出 ) : 并行存储体的个数m≥n,并且取质数,同时还要在行、列方向上错开一定的距离存储数组元素。 设同一列相邻元素在并行存储器中错开d1个存储体存放,同一行相邻元素在并行存储器中错开d2个存储体存放。当m=22p+1(p为任意自然数)时,能够同时实现按行、按列、按对角线和按反对角线无冲突访问的充要条件是:d1=2P,d2=1。 例如:4×4的二维数组,取并行存储体的个数m=5,由关系式m=22P+1,解得到p=1,计算得到: d1=21=2 d2=1 n×n数组中的任意一个元素aij在无冲突并行存储器中的体号地址和体内地址的计算公式: 体号地址:(2P i+j+k) MOD m 体内地址:i 其中:0≤i≤n-1, 0≤j≤n-1, k是数组的第一个元素a00所在体号地址, m是并行存储体的个数,要求m≥n且为质数, p是满足m=22P+1关系的任意自然数。 主要缺点:浪费存储单元 对于n×n数组,有(m-n) × m个存储单元浪费 主要优点:实现简单 列元素顺序存储,行元素按地址取模顺序存储
您可能关注的文档
最近下载
- 【医学课件】 Pseudomonas aeruginosa biofilm formation.ppt VIP
- 瞿同祖中国法律与中国社会.ppt VIP
- 2025年山东省春季高考数学试卷试题真题(含答案解析).pdf VIP
- 2024-2025学年高一下学期《唤醒内驱力——开启自主学习成长之旅》主题班会课件.pptx VIP
- 低钾血症.ppt VIP
- 2025年《大数据营销》考试试卷及答案.pdf VIP
- 江苏省无锡市锡山区天一实验学校2023-2024学年七年级上学期期中数学试题.doc VIP
- 智能交通信息采集技术12_浮动车课件讲解.pptx VIP
- 智学网官网登录入口.docx VIP
- 常用房屋体检设备清单及技术参数、软件要求、数据资产、屋体检报告、评价判定表.pdf VIP
原创力文档


文档评论(0)