计算机系统结构 计算机系统结构 王若成 教研室:B-4028 目 录 第1章 计算机系统结构基本概念 第2章 数据表示与指令系统 第3章 总线、中断与输入输出系统 第4章 存储体系 第5章 重叠、流水和向量处理机 第6章 阵列处理机 第7章 多处理机 第8章 其它计算机结构 8.1 脉动阵列机 8.2 大规模并行处理机与机群系统 8.3 数据流机 8.4 归约机 8.5 智能机 8.1 脉动阵列处理机 脉动阵列结构是由一组处理单元PE构成的阵列。每个PE的内部结构相同,一般由一个加法/逻辑运算部件或加法/乘法运算部件再加上若干个锁存器构成,可完成少数基本的算术逻辑运算操作。阵列内所有处理单元的数据锁存器都受同一个时钟控制。运算时数据在阵列结构的各个处理单元间沿各自的方向同步向前推进。称其为脉动阵列结构。 为了执行多种计算,脉动型系统内的输入数据流和结果数据流可以在多个不同方向上以不同速度向前搏动。 阵列内部的各个单元只接收前一组处理单元传来的数据,并向后一组处理单元发送数据。 只有位于阵列边缘的处理单元,才与存储器或I/O端口进行数据通信。 主要适用于计算量很大的信号/图像处理,以及某些特定计算类算法题目的求解,特别是需要对大量数据执行重复计算的运算受限类问题的求解。 例如给出了在一个脉动式二维阵列结构上进行两个3×3矩阵A、B相乘的例子。每个处理单元PE内含一个乘法器和一个加法器,可完成一个内积步运算。每经一拍,处理单元可把3个输入端送来的信息沿三个不同方向,即由左向右的水平方向、由下向上的垂直方向和由左下角到右上角的斜45°方向,同时将结果传送到对应的3个输出端,使a′←a , b′←b , d←a·b+c。 给出了t1、t2、t3时刻送入阵列中的数据情况,到t6时,从斜45°向右上角将同时输出c13、c12、c11、c21、c31的值,t7时输出c23、c22、c32的值,t8时输出c33的值。可以看出,总共只需要8拍就可以完成两个3×3的矩阵相乘,比单处理机上循环执行所需的27拍,速度提高了两倍多。 两个n×n矩阵的相乘,用3n2-3n+1个PE构成的脉动阵列上只需3n-1步运算即可全部完成,运算所需要的时间只是以近似3n的线性关系增加,比用单处理机的近似n3的关系增加要小得多。当n较大时,采用脉动阵列进行运算的速度提高尤为显著。 脉动阵列结构具有如下一些特点: (1)结构简单、规整,模块化强,可扩充好,非常适合用超大规模集成电路实现。 (2)PE间数据通信距离短、规则,使数据流和控制流的设计、同步控制等均简单规整。 (3)脉动阵列中所有PE能同时运算,具有极高的计算并行性,可通过流水获得很高的运算效率和吞吐率。 (4)脉动阵列结构的构形与特定计算任务和算法密切相关,具有某种专用性,限制了应用范围,这对VLSI是不利的。 8.1.2 通用脉动阵列结构 受阵列结构的通用性及I/O带宽约束所限制的阵列结构的规模大小的限制,脉动阵列机应用范围是有限的。不同的算法往往要求能有不同的阵列结构,以及大小不同的阵列。为了克服脉动阵列结构通用性差的弱点,研究和发展了一些可有效执行多种算法的较为通用的脉动阵列结构。 发展通用脉动阵列结构的途径有三种。 第一种途径是通过增设附加的硬件,对阵列的拓扑结构和互连方式用可编程开关进行重构,即经程序重新配置阵列的结构。 美国Purdue大学的可重构高度并行计算机CHiP就是典型的例子。 第二种途径是用软件把不同的算法映像到固定的阵列结构上。 这一方法依赖于面向并行运算所采用的程序语言、操作系统、编译程序和软件开发工具的设计。 美国卡内基-梅隆大学用于信号、图像和计算机视觉处理的WARP机是一台由10个以上处理单元组成的线形脉动阵列机。 第三种途径是探寻与问题大小无关的脉动处理方法,以及VLSI运算系统的分割矩阵算法,使它们可以克服阵列只能求解固定大小题目的缺陷,同时探寻发展适合一类计算问题的通用算法和相应的设置方案。 8.2大规模并行处理机与机群系统 发展背景: 由于VLSI和微处理技术的发展,以及高科技应用领域对计算机和通信网络在计算、处理和通信性能上不断提出更高的要求(极大的处理数据量、异常复杂的运算、很不规则的数据结构、极高的处理速度),使发展大规模的并行处理成了20世纪80年代中期计算机发展的热点。 大规模并行处理机: 通过新的计算方法、存储技术、处理手段和结构组织方式,将数百至数万个高性能、低成本的RISC微处理器用专门的互连网络互连,组成大规模并行处理机MPP。这种处理机可进行中粒度和细粒度大
您可能关注的文档
- 2016届高三第三次市统考模拟政治试题分析.doc
- 2016届高三第一轮复习第五章第2节分析.ppt
- 2016届高三第一轮复习第五章第1节分析.ppt
- 第7章 机件的基本表示法.ppt
- 2016届高考化学一轮复习课时提升练7铝及其化合物分析.doc
- 2016届高考化学一轮复习11无机非金属材料的主角-硅讲义分析.doc
- 2016届高考化学二轮复习全国卷近5年模拟试题分考点汇编合金(含解析)分析.doc
- 2016届高考化学一轮复习:第八章水溶液中的离子平衡第2讲分析.ppt
- 2016届高考化学二轮复习全国卷近5年模拟试题分考点汇编获取洁净的水(含解析)分析.doc
- 2016届高考历史一轮复习11.21苏联的社会主义建设课时提升作业分析.doc
- 2025年版汽车趋势报告 The 2025 EPA Automotive Trends Report.docx
- 2026年边缘计算开源平台EdgeX Foundry入门与二次开发.docx
- 2026年超声内镜放大内镜早癌诊断AI辅助识别系统临床评价.docx
- 2026年报废汽车回收与再制造逆向物流体系.docx
- 2026年产品碳足迹核算方法学:从摇篮到大门与从摇篮到坟墓.docx
- 2026年城乡要素平等交换双向流动政策创新试点申报材料.docx
- 2026年超导半导体接口电路架构与电平转换驱动器设计.docx
- 2026年财政贴息不再以再贷款支持为前提后的风险防范与合规要点.docx
- 2026年不动产信托登记试点政策对遗嘱信托支持.docx
- 2026年城乡有机废弃物协同处理技术方案.docx
最近下载
- 2025年唐山市路北区辅警(协警)招聘考试题库附答案解析.docx VIP
- 《4.2 大学之道》教案、导学案、同步练习(附教学设计).docx
- Unit 6 Birthdays Lesson 1(课件)-三年级英语上学期(人教新起点版).pptx VIP
- 初一初中语文现代文阅读理解专题训练含答案(完整打印版).pdf VIP
- Q321183 JH005-2020 JH先张法预应力超高强混凝土管桩.pdf VIP
- 2025年锦州师范高等专科学校单招职业适应性考试题库及答案参考.docx
- 年产300吨猕猴桃果酒的工厂设计.docx VIP
- 2024年广东省航道事务中心所属事业单位招聘考试真题.pdf VIP
- 点到为止、不得罪人的简短生活会相互批评意见100条.docx VIP
- 2025年演出经纪人紧急事件处理中的团队沟通与决策专题试卷及解析.pdf VIP
原创力文档

文档评论(0)