[理学]第三章_流水线技术房老师班.ppt

  1. 1、本文档共138页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]第三章_流水线技术房老师班

例3.2 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t,其余各段时间均为△t,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。若在该流水线上计算: 试计算其吞吐率、加速比和效率。 1. 要保证不会在同一时钟周期要求同一个功能段做两件不同的工作。 例如,不能要求ALU同时做有效地址计算和算术运算。 2. 避免IF段的访存(取指令)与MEM段的访存(读/写数据)发生冲突。 可以采用分离的指令存储器和数据存储器; 一般采用分离的指令Cache和数据Cache。 3. ID段和WB段都要访问同一寄存器文件。 ID段:读   WB段:写 第三章 流水线技术 流水线实现时要注意的问题 4. 考虑PC的问题 流水线为了能够每个时钟周期启动一条新的指令,就必须在每个时钟周期进行PC值的加4操作,并保留新的PC值。这种操作必须在IF段完成,以便为取下一条指令做好准备。 (需设置一个专门的加法器) 但分支指令也可能改变PC的值,而且是在MEM段进行,这会导致冲突。 请考虑一下,如何处理分支指令? 第三章 流水线技术 流水线中的相关 - 结构相关 为什么流水线机器有时允许结构相关存在? (1)减少硬件代价; (2)减少功能单元的延迟。 性能评价主要参数: 向量指令处理时间 Tvp 向量长度为无穷大时的向量处理机峰值性能 R∞ 半性能向量长度 n1/2 向量长度临界值 nv 第三章 流水线技术 向量处理机 向量指令的格式:操作码、源或目的操作数地址、地址偏移量、地址增量、向量长度等。 (1)操作码反映向量指令进行的操作; (2)源操作数和目的操作数地址,因指令不同可能有多组,每组操作数地址字段因操作数存放部件不同而不同。如果存放在向量寄存器组中,应指明向量寄存器组的组号,如果存放在主存中,应指明向量首元素在主存中的首地址(基地址); (3)地址偏移量可正可负,将其与基地址求和,可得到该向量实际参与运算的首元素地址(实际地址); (4)地址增量用来指明向量中相邻元素之间的地址步距; (5)向量长度用以指明向量的全部元素个数,以便检验具体元素的地址是否越界。 第三章 流水线技术 向量处理机 1.向量指令的处理时间 : 执行一条向量长度为 n 的向量指令所需的时间为: Tvp = Ts + Tvf + (n-1)Tc Ts :向量处理单元流水线的建立时间,包括:向量起始地址的设置、计数器加1、条件转移指令执行等; Tvf :向量处理单元流水线的流过时间,是从向量指令开始执行到得到第一个计算结果(向量元素)所需的时间; Tc :向量处理单元流水线“瓶颈”段的执行时间。 第三章 流水线技术 向量处理机-向量指令处理时间 如果向量处理单元流水线不存在“瓶颈”段,每 段的执行时间等于一个时钟周期,则上式也可 以写为: Tvp = [s + e + (n-1)]Tclk 第三章 流水线技术 向量处理机-向量指令处理时间 s:向量处理单元流水线建立所需的时钟周期数; e:向量流水线流过所需的时钟周期数; Tclk:时钟周期时间。 可以再改写为: Tvp = (Tstart + n)Tclk Tstart :向量功能部件启动所需的时钟 周期数; n:向量元素个数。 第三章 流水线技术 向量处理机-向量指令处理时间 对于一组向量指令,其执行时间主要取决于 三个因素: 向量的长度 向量操作之间是否链接 向量功能部件的冲突和数据的相关性 把几条能在同一个时钟周期内一起开始执行的向量指令集合称为一个编队。 第三章 流水线技术 向量处理机-向量指令处理时间 第三章 流水线技术 向量处理机 例:计算Y=a*X+Y,X和Y为向量,a为标量。程序如下: I1 LV V1, Rx I2 MULTSV V2, F0, V1 I3 LV V3, Ry I4 ADDV V4, V2, V3 I5 SV Ry V4 第三章 流水线技术 向量处理机 不采用链接技术时,可把上述五条指令分成四个编队: (1)LV V1,Rx (2)MULTSV V2,F0,V1 和LV V3,Ry (3)ADDV V4,V2,V3 (4)SV Ry V4 第三章 流水线技术 向量处理机 思考1: 如果考虑向量长度大于向量寄存器长度时,则需要分段开采。考虑采用分段开采向量长度为n的一组向量的整个执行时间是? 思考2: 假设处理的向量长度一致,采用链接技术可以如何编队? 2. 向量处理机的峰值性能R? R?表示

文档评论(0)

ipbohn97 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档