- 5
- 0
- 约8.71千字
- 约 56页
- 2018-08-09 发布于浙江
- 举报
§3 向量的流水理与向量流水处理机
§3 向量的流水处理与向量流水处理机 将向量数据表示和流水线技术结合起来,构成向量流水处理机,简称向量处理机(Vector Processor) 向量的流水处理 向量流水处理机 向量的流水处理 提高流水性能方法: 增加流水线段数,以减少Δt 每个时钟同时启动多条指令 减少相关,减少功能变换次数,增加处理指令条数。 向量的流水处理(续) 向量操作特点 向量元素间操作相互独立,且为相同操作 相当于标量循环,对指令带宽的访问要求不高 可采用多体交叉存储器,减少访存延迟。 向量操作很适合于流水处理或并行处理。 向量的流水处理(续) 向量处理过程 置VL、VM、A 取向量到V 运算。 向量的分量间采取的是流水方式。 并行处理机(SIMD)处理向量时采取的是并行方式。 向量的流水处理(续) 向量处理工作方式 如:D=A×(B+C) 横向加工:bi+ci-k, k*ai-di 产生N次相关,2N次功能切换,适合标量循环 纵向加工:bi+ci-ki, ki*ai-di 产生1次相关,1次功能切换,可流水处理 纵横处理:对向量分组,组内纵向、组间横向处理 向量流水处理机 向量流水处理机的指令系统 向量流水处理机的结构 超级向量流水处理机举例 向量流水处理机的指令系统 包含有向量型和标量型两类指令 向量型运算类指令 向量V1运算得向量V2,如V2=SIN(V1) 向量V运算得标量S,如 向量V1与向量V2运算得向量V3,V3=V1^V2 向量V1与标量S运算得向量V2,V2=S*V1 特殊操作指令 向量比较指令 向量压缩指令 归并指令 向量传送指令 向量流水处理机的结构 1972年首次交付使用CRAY-1向量流水处理机 分布异构型多处理机系统,由中央处理机、诊断维护控制处理机、大容量磁盘存储子系统、前端处理机组成 6个流水线单功能部件:整数加、逻辑运算、移位、浮点加、浮点乘和浮点迭代求倒数 向量寄存器由512个64位寄存器组成,分成8组 超级向量流水处理机举例 1972年成立CRAY公司,至今生产了400台以上的超级计算机 1979年CRAY-1S,CRAY-1改进型,有10条流水线 1983年CRAY X-MP,用4台CRAY-1 1985年CRAY-2S 1988年CRAY Y-MP,8台处理机 1991年CRAY Y-MP C-90 1996年12月,克雷研究公司也被SGI公司以7.5亿美元收购 目前产品:MTA、SV1、SX_6、T3E 2002年Cray X1。运算速度最高为每秒52万亿次,支持65.5TB存储器。 宣布了在2010年以前实现能够连续地处理每秒1000万亿次 网址: 超级向量流水处理机举例(续) CDC公司1973年推出第一台超级计算机STAR-100 1964年CDC-6600 RISC特征 1982年 CYBER 205 ETA10:8个CPU 网址: §4 指令级高度并行的超级计算机 超标量处理机 超长指令字处理机 超流水线处理机 超标量处理机 采用多指令流水线(度=m) 配置多套功能部件、指令译码电路和多组总线,并且寄存器也备有多个端口和多组总线。 适合于求解稀疏向量、矩阵 IBM RS/6000、DEC 21064、Intel i960CA、Tandem Cyclone(飓风)等 超标量处理机(续) 超标量处理机基本结构 一般流水线处理机: 一条指令流水线 一个多功能操作部件,每个时钟周期平均执行指令的条数小于1。 多操作部件处理机: 一条指令流水线 多个独立的操作部件,操作部件可以采用流水线,也可以不流水 多操作部件处理机的指令级并行度小于1 超标量处理机典型结构: 多条指令流水线 进的超标量处理机有:定点处理部件CPU,浮点处理部件FPU,图形加速部件GPU 大量的通用寄存器,两个一级高速Cache 超标量处理机的指令级并行度大于1 举例: Motorola公司的MC88110 10个操作部件 两个寄存器堆:整数部件通用寄存器堆,32个32位寄存器;浮点部件扩展寄存器堆,32个80位寄存器。每个寄存器堆有8个端口,分别与8条内部总线相连接,有一个缓冲深度为4的先行读数栈和一个缓冲深度为3的后行写数栈。 两个独立的高速Cache中,各为8KB,采用两路组相联方式。 转移目标指令Cache,在有两路分支时,存放其中一路分支上的指令 超标量处理机MC88110的结构 单发射与多发射 单发射处理机: 每个周期只取一条指令、只译码一条指令,只执行一条指令,只写回一运算结果 取指部件和译码部件各设置一套 可以只设置一个多功能操作部件,也可以设置多个独立的操作部件 操作部件中可以采用流水线结构,也可以不采用流水线结构 设计目标是每个时钟周期平均执行一条指令,ILP
您可能关注的文档
- [精彩]第四章 路基防护与固_1602302597.ppt
- [精彩]第章 路基的防护与加固(a).ppt
- [精彩]第五-1章-连续化方法计算联肢剪墙_图文.ppt
- [精彩]第2章 修培植备装置识图与施工(给水识图).ppt
- [精彩]管道第5章(5.4给排水例题)_图文.ppt
- [精彩]筏基础作业建设_1934588255.ppt
- [精彩]给排水及热通识图与施工工艺(教教化用).ppt
- [精彩]筏板基础施工_160435458.ppt
- [精彩]粘土边坡的安系数计算.ppt
- [精彩]纤维素酶离子液体兼系统水解木质纤维素生物质.ppt
- 我国寿险业2.0时代的趋势与破局.pptx
- 腾讯安全沙龙:低空防线:无人机通信协议模糊测试与系统安全研究新突破.docx
- 特斯拉热泵详解 Tesla Model Y Heat Pump Based on Tesla US Patent application.pdf
- 南亚地区高等教育数字化转型报告.pdf
- 2025无源物联网白皮书-人工智能篇 Ambient IoT — Artificial Intelligence Chapter.pdf
- 最好的筛查测试是那些能得到后续跟踪的测试 The best screening test is the one that gets followed up on.pdf
- 关于基于电力数据的零碳园区碳资产管理体系的研究.docx
- 腾讯安全沙龙:低空防线:无人机通信协议模糊测试与系统安全研究新突破.pptx
- 轻工制造行业专题研究:NAS:“AI”为翼,破圈前行.pdf
- 关于近零碳排放园区建设模式与实践探索的系统分析.docx
原创力文档

文档评论(0)