- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机系统结构 计算机系统结构 王若成 教研室:B-4028 目 录 第1章 计算机系统结构基本概念 第2章 数据表示与指令系统 第3章 总线、中断与输入输出系统 第4章 存储体系 第5章 重叠、流水和向量处理机 第6章 阵列处理机 第7章 多处理机 第8章 其它计算机结构 8.1 脉动阵列机 8.2 大规模并行处理机与机群系统 8.3 数据流机 8.4 归约机 8.5 智能机 8.1 脉动阵列处理机 脉动阵列结构是由一组处理单元PE构成的阵列。每个PE的内部结构相同,一般由一个加法/逻辑运算部件或加法/乘法运算部件再加上若干个锁存器构成,可完成少数基本的算术逻辑运算操作。阵列内所有处理单元的数据锁存器都受同一个时钟控制。运算时数据在阵列结构的各个处理单元间沿各自的方向同步向前推进。称其为脉动阵列结构。 为了执行多种计算,脉动型系统内的输入数据流和结果数据流可以在多个不同方向上以不同速度向前搏动。 阵列内部的各个单元只接收前一组处理单元传来的数据,并向后一组处理单元发送数据。 只有位于阵列边缘的处理单元,才与存储器或I/O端口进行数据通信。 主要适用于计算量很大的信号/图像处理,以及某些特定计算类算法题目的求解,特别是需要对大量数据执行重复计算的运算受限类问题的求解。 例如给出了在一个脉动式二维阵列结构上进行两个3×3矩阵A、B相乘的例子。每个处理单元PE内含一个乘法器和一个加法器,可完成一个内积步运算。每经一拍,处理单元可把3个输入端送来的信息沿三个不同方向,即由左向右的水平方向、由下向上的垂直方向和由左下角到右上角的斜45°方向,同时将结果传送到对应的3个输出端,使a′←a , b′←b , d←a·b+c。 给出了t1、t2、t3时刻送入阵列中的数据情况,到t6时,从斜45°向右上角将同时输出c13、c12、c11、c21、c31的值,t7时输出c23、c22、c32的值,t8时输出c33的值。可以看出,总共只需要8拍就可以完成两个3×3的矩阵相乘,比单处理机上循环执行所需的27拍,速度提高了两倍多。 两个n×n矩阵的相乘,用3n2-3n+1个PE构成的脉动阵列上只需3n-1步运算即可全部完成,运算所需要的时间只是以近似3n的线性关系增加,比用单处理机的近似n3的关系增加要小得多。当n较大时,采用脉动阵列进行运算的速度提高尤为显著。 脉动阵列结构具有如下一些特点: (1)结构简单、规整,模块化强,可扩充好,非常适合用超大规模集成电路实现。 (2)PE间数据通信距离短、规则,使数据流和控制流的设计、同步控制等均简单规整。 (3)脉动阵列中所有PE能同时运算,具有极高的计算并行性,可通过流水获得很高的运算效率和吞吐率。 (4)脉动阵列结构的构形与特定计算任务和算法密切相关,具有某种专用性,限制了应用范围,这对VLSI是不利的。 8.1.2 通用脉动阵列结构 受阵列结构的通用性及I/O带宽约束所限制的阵列结构的规模大小的限制,脉动阵列机应用范围是有限的。不同的算法往往要求能有不同的阵列结构,以及大小不同的阵列。为了克服脉动阵列结构通用性差的弱点,研究和发展了一些可有效执行多种算法的较为通用的脉动阵列结构。 发展通用脉动阵列结构的途径有三种。 第一种途径是通过增设附加的硬件,对阵列的拓扑结构和互连方式用可编程开关进行重构,即经程序重新配置阵列的结构。 美国Purdue大学的可重构高度并行计算机CHiP就是典型的例子。 第二种途径是用软件把不同的算法映像到固定的阵列结构上。 这一方法依赖于面向并行运算所采用的程序语言、操作系统、编译程序和软件开发工具的设计。 美国卡内基-梅隆大学用于信号、图像和计算机视觉处理的WARP机是一台由10个以上处理单元组成的线形脉动阵列机。 第三种途径是探寻与问题大小无关的脉动处理方法,以及VLSI运算系统的分割矩阵算法,使它们可以克服阵列只能求解固定大小题目的缺陷,同时探寻发展适合一类计算问题的通用算法和相应的设置方案。 8.2大规模并行处理机与机群系统 发展背景: 由于VLSI和微处理技术的发展,以及高科技应用领域对计算机和通信网络在计算、处理和通信性能上不断提出更高的要求(极大的处理数据量、异常复杂的运算、很不规则的数据结构、极高的处理速度),使发展大规模的并行处理成了20世纪80年代中期计算机发展的热点。 大规模并行处理机: 通过新的计算方法、存储技术、处理手段和结构组织方式,将数百至数万个高性能、低成本的RISC微处理器用专门的互连网络互连,组成大规模并行处理机MPP。这种处理机可进行中粒度和细粒度大
您可能关注的文档
- 2016届高三第三次市统考模拟政治试题分析.doc
- 2016届高三第一轮复习第五章第2节分析.ppt
- 2016届高三第一轮复习第五章第1节分析.ppt
- 第7章 机件的基本表示法.ppt
- 2016届高考化学一轮复习课时提升练7铝及其化合物分析.doc
- 2016届高考化学一轮复习11无机非金属材料的主角-硅讲义分析.doc
- 2016届高考化学二轮复习全国卷近5年模拟试题分考点汇编合金(含解析)分析.doc
- 2016届高考化学一轮复习:第八章水溶液中的离子平衡第2讲分析.ppt
- 2016届高考化学二轮复习全国卷近5年模拟试题分考点汇编获取洁净的水(含解析)分析.doc
- 2016届高考历史一轮复习11.21苏联的社会主义建设课时提升作业分析.doc
文档评论(0)