- 1、本文档共55页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
8计算机系统结构(第的八讲)
计算机系统结构(第八讲);第五章 标量处理机;5.3.2 超流水线处理机;什么是超流水线处理机?
这种在一个基本时钟周期内能够分时发射多条指令的处理机称为超流水线处理机
超流水线处理机:流水线的级数≥8
超标量处理机:是以增加硬件资源为代价来换取处理机的性能;空间并行性
超流水线处理机:只需增加少量硬件,是通过各部分硬件的充分重叠工作来提高处理机的性能;时间并行性
;5.3.2.1 指令执行时序;5.3.2.2 典型处理机结构;图5.81:MIPS R4000处理机的流水线操作
8级流水线、每个时钟周期包含两个流水线;图5.82:MIPS R4000正常指令流水线工作时序
一个时钟周期内,流水线执行完成了两条指令;图5.83:LOAD指令引起的流水线暂停
暂停一个时钟周期(两个流水线周期);5.3.2.3 超流水线处理机性能;5.3.3 超标量超流水线处理机;超标量处理机:在一个时钟周期内发射??条指令;主要开发空间并行性,依靠多个操作在重复设置的操作部件上同时执行来提高程序的执行速度
超流水线处理机:把一个时钟周期细分为多个流水线周期,每一个时钟周期能够发射并执行完成多条指令;主要开发时间并行性,在同一操作部件上重叠多个操作,通过使用较快时钟周期的深度流水线来加快程序的执行速度
超标量超流水线处理机:超标量处理机+超流水线处理机;5.3.3.1 指令执行时序;5.3.3.2 典型处理机结构;图5.86:Alpha 21064处理机的指令流水线结构
三条指令流水线:
(1)、整数操作流水线(7级)
(2)、访问存储器流水线(7级)
(3)、浮点操作流水线(10级)
每个指令流水线的前四个流水级(IF、SWAP、I0、I1)采用静态流水线
每个指令流水线的后3~6个流水级采用动态流水线
Alpha 21064处理机:每个时钟周期能够发射两条指令;三条指令流水线的平均级数为8级;属于超标量超流水线处理机
;5.3.3.3 超标量超流水线处理机性能;图5.87:三种指令级并行处理机的相对性能
横坐标:处理机的设计指令级并行度(m*n)
纵坐标:处理机能够达到的实际指令级并行度
结论:
(1)、超标量处理机相对性能最高,其次是超标量超流水线处理机,超流水线处理机的相对性能最低;
(2)、一般认为m和n都不要超过4;
(3)、一个特定程序由于受到本身的数据相关和控制相关的限制,它的指令级并行度的最大值是确定的,这个最大值主要由程序自身的语义来决定,与这个程序运行在那一种处理机上无关。 ;本章总结;先行控制技术;先行控制技术----缓冲技术;先行控制技术----数据相关;先行控制技术----控制相关(1);先行控制技术----控制相关(2)转移预测技术;先行控制技术----控制相关(3)短循环程序的处理;流水线处理机;流水线处理机----时空图;流水线处理机----流水线的分类;流水线处理机----线性流水线的性能分析;流水线处理机----非线性流水线的调度技术;流水线处理机----局部相关;流水线处理机----全部相关;超标量处理机与超流水线处理机;第六章 向量处理机;向量处理机已成为解决数值计算问题的一种最重要的高性能结构
绝大多数向量处理机都采用流水线结构
向量处理机与串行处理机相比,向量运算吞吐率要高出1~2个数量级
本章的目的:描述向量处理机的一般结构;讨论算法和结构如何配合才能高效地处理多类计算机的问题;6.1 向量处理的基本概念;6.1.1 什么是向量处理;例子:
FORTRAN语言程序
在一般计算机上的实现(指令序列)
在向量计算机上的实现(向量指令)
一条标量指令只能处理一个或一对操作数
一条向量指令可以处理N个或N对操作数
;6.1.2 向量处理方式;三种类型:
(1)、横向处理方式
适用于一般的处理机(标量处理机),不适用于向量处理机的并行处理
(2)、纵向处理方式
适用于向量处理机,对存储器的信息流量要求较高
(3)、纵横处理方式
可以降低对存储器信息流量的要求,也减少访问存储器发生冲突所引起的等待时间,提高了处理速度;6.2 向量处理机的结构;图6.1:一种能实现两个向量相加的流水结构的加法器;向量处理机对存储器的带宽要求高(至少3倍于一般的存储器系统)
流水线运算器是向量计算机的核心部件
两种方法:
(1)、存储器-存储器结构
如N个独立的存储模块
(2)、寄存器-寄存器结构
中间存储器的容量较小,所以存取速度比较快,从而获得较高的带宽
;6.2.1 存储器-存储器结构;图6.2:一个具有由8个三端口存储器模块组成的存储器系统的向量处理机
主存储器:8个模块;
图6.3:向量
您可能关注的文档
最近下载
- 机械测量培训课程.pptx
- 医疗器械安全有效基本要求清单填写参考模板2024年.docx
- 人教版(2024)数学一年级下册四 100以内的口算加、减法 练习.pptx
- 电气装置安装工程质量检验及评定规程DLT5161 2018.doc
- 做好客舱清洁前准备课件讲解.pptx
- 铁道信号论文-信号机维护与故障处理.doc
- ISO13485质量手册+全套程序文件.docx VIP
- 汽车机械维修工(高级技师)职业鉴定考试题库资料(高频300题).pdf
- 多维视角下梧州市普通高中体育生学训现状剖析与发展路径探索.docx
- 江南事业编招聘考试题历年公共基础知识真题汇总-综合应用能力(2010-2021.pdf VIP
文档评论(0)