系统结构流水线向量作业答案.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4、1 一条线性静态多功能流水线由6 个功能段组成,加法操作使用其中的1、2、3、6 功能段,乘法操作使用其中的1、4、5、6 功能段,每个功能段的执行时间均为Δt,流水线的输出端与输入端之间有直接数据通路,且设置有足够的缓冲寄存器。 试用尽可能短的时间计算 画出流水线时空图,并计算流水线的实际吞吐率、加速比和效率。 F: (a1 × b1 + a2 × b2 ) + (a3 × b3 + a4 × b4 ) + (a5 × b5 + a6 × b6 ) 按先乘后加、先括号内后括号外的优先次序,上述计算F 的过程需要先做6 次乘法, 用1~6 表示;再做3 个括号内的3 次加法,用7~9 表示;最后做括号外的2 次加法,用10~11 表示。 流水线时空图如下: 4、2 在一个5 段的流水线处理机上需经9Δt 才能完成一个任务,各段执行时间均为Δt,任务处理过程对各段使用时间的预约表如下表所示。 (1)画出流水线的状态有向图,并由状态图得出流水线的最优调度策略和最大吞吐率。 (2)按最优调度策略输入6 个任务,求流水线的实际吞吐率、加速比和效率 C0= ,然后运算 状态有向图: 最优调度策略是(2, 5),流水线的最大吞吐率就是最优调度策略的最大吞吐率,有TPmax=1/3.5Δt E=6*11/5*125=0.528 4、3设有一台时钟频率为f =200MHz 的向量流水处理机,其中,向量加流水处理部件完成一次加运算需要6 个时钟周期,向量乘流水处理部件完成一次乘运算需要7个时钟周期,访存流水处理部件对存储器读/写一个数据需要12 个时钟周期,所有流水处理部件对向量元素的处理需要1 个时钟周期。V 为向量寄存器,S 为标量寄存器,向量长度为n。处理机执行下述向量指令序列: V1 ←存储器 V2 ←V1×S V3 ←存储器 V4 ←V2+V3 存储器←V4 (1)处理机顺序执行各向量指令且不链接,若n=64,计算处理机的执行时间。 (2)若向量元素都是浮点数,计算处理机执行该指令序列的MFLOPS 速率。 (3)若指令序列在标量处理机上以顺序方式执行,忽略向量横向处理的循环控制等时间开销,计算标量处理机的执行时间,并计算向量流水处理机相对标量处理机的加速比。 Δt=187×10–8 s 2、MFLOPS=2*64/(187*10–8 s*106 ) = 68 3、5 条向量指令在标量处理机上以顺序方式处理,各自需要的处理时间分别为: T1 = 64×12Δt = 768Δt T2 = 64×7Δt = 448Δt T3 = 64 ×12Δt = 768Δt T4 = 64 × 6Δt = 384Δt T5 = 64 ×12Δt = 768Δt 标量处理机顺序执行所需要的时间为: T=T1+T2+T3+T4+T5 =3136Δt=3136×5×10–9 s =1568×10–8 s 加速比为:Sp=1568×10–8 /187×10–8 =8.39 4、4 设向量流水处理机向量长度均为32,S 为标量寄存器,V 为向量寄存器。设启动功能部件(包括存储器)需要时间Δt,一个数据打入寄存器需要时间Δt,从存储器读/写一个数据需要时间6Δt,完成一对数据的加运算需要时间6Δt,完成一对数据的乘运算需要时间7Δt。 问下列各指令组中,哪些指令可以同时并行?哪些指令可以链接?分别计算各指令组的执行时间。 Δt 2、1,2,3Δt 3、1,2并行,然后与3,4链接 1+6+1+1+7+1+1+6+1+32-1=56Δt 4、1,2链接,然后3,然后4串行1+6+1+1+6+1+32-1+1+7+1+32-1 +1+7+1+32-1=127Δt

文档评论(0)

8jmoiza5u9 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档