系统结构流水线向量作业答案.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4、1 一条线性静态多功能流水线由6 个功能段组成,加法操作使用其中的1、2、3、6 功能段,乘法操作使用其中的1、4、5、6 功能段,每个功能段的执行时间均为Δt,流水线的输出端与输入端之间有直接数据通路,且设置有足够的缓冲寄存器。 试用尽可能短的时间计算 画出流水线时空图,并计算流水线的实际吞吐率、加速比和效率。 F: a1 × b1 + a2 × b2 + a3 × b3 + a4 × b4 + a5 × b5 + a6 × b6 按先乘后加、先括号内后括号外的优先次序,上述计算F 的过程需要先做6 次乘法, 用1~6 表示;再做3 个括号内的3 次加法,用7~9 表示;最后做括号外的2 次加法,用10~11 表示。 流水线时空图如下: 4、2 在一个5 段的流水线处理机上需经9Δt 才能完成一个任务,各段执行时间均为Δt,任务处理过程对各段使用时间的预约表如下表所示。 (1)画出流水线的状态有向图,并由状态图得出流水线的最优调度策略和最大吞吐率。 (2)按最优调度策略输入6 个任务,求流水线的实际吞吐率、加速比和效率 C0 ,然后运算 状态有向图: 最优调度策略是 2, 5 ,流水线的最大吞吐率就是最优调度策略的最大吞吐率,有TPmax 1/3.5Δt E 6*11/5*125 0.528 4、3设有一台时钟频率为f 200MHz 的向量流水处理机,其中,向量加流水处理部件完成一次加运算需要6 个时钟周期,向量乘流水处理部件完成一次乘运算需要7个时钟周期,访存流水处理部件对存储器读/写一个数据需要12 个时钟周期,所有流水处理部件对向量元素的处理需要1 个时钟周期。V 为向量寄存器,S 为标量寄存器,向量长度为n。处理机执行下述向量指令序列: V1 ←存储器 V2 ←V1×S V3 ←存储器 V4 ←V2+V3 存储器←V4 (1)处理机顺序执行各向量指令且不链接,若n 64,计算处理机的执行时间。 (2)若向量元素都是浮点数,计算处理机执行该指令序列的MFLOPS 速率。 (3)若指令序列在标量处理机上以顺序方式执行,忽略向量横向处理的循环控制等时间开销,计算标量处理机的执行时间,并计算向量流水处理机相对标量处理机的加速比。 Δt 187×10–8 s 2、MFLOPS 2*64/(187*10–8 s*106 ) 68 3、5 条向量指令在标量处理机上以顺序方式处理,各自需要的处理时间分别为: T1 64×12Δt 768Δt T2 64×7Δt 448Δt T3 64 ×12Δt 768Δt T4 64 × 6Δt 384Δt T5 64 ×12Δt 768Δt 标量处理机顺序执行所需要的时间为: T T1+T2+T3+T4+T5 3136Δt 3136×5×10–9 s 1568×10–8 s 加速比为:Sp 1568×10–8 /187×10–8 8.39 4、4 设向量流水处理机向量长度均为32,S 为标量寄存器,V 为向量寄存器。设启动功能部件(包括存储器)需要时间Δt,一个数据打入寄存器需要时间Δt,从存储器读/写一个数据需要时间6Δt,完成一对数据的加运算需要时间6Δt,完成一对数据的乘运算需要时间7Δt。 问下列各指令组中,哪些指令可以同时并行?哪些指令可以链接?分别计算各指令组的执行时间。 Δt 2、1,2,3Δt 3、1,2并行,然后与3,4链接 1+6+1+1+7+1+1+6+1+32-1 56Δt 4、1,2链接,然后3,然后4串行1+6+1+1+6+1+32-1+1+7+1+32-1 +1+7+1+32-1 127Δt

文档评论(0)

lyxbb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档