系统结构流水线量作业答案.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
系统结构流水线量作业答案

4、1 一条线性静态多功能流水线由6 个功能段组成,加法操作使用其中的1、2、3、6 功能段,乘法操作使用其中的1、4、5、6 功能段,每个功能段的执行时间均为Δt,流水线的输出端与输入端之间有直接数据通路,且设置有足够的缓冲寄存器。 试用尽可能短的时间计算 画出流水线时空图,并计算流水线的实际吞吐率、加速比和效率。 F: (a1 × b1 + a2 × b2 ) + (a3 × b3 + a4 × b4 ) + (a5 × b5 + a6 × b6 ) 按先乘后加、先括号内后括号外的优先次序,上述计算F 的过程需要先做6 次乘法, 用1~6 表示;再做3 个括号内的3 次加法,用7~9 表示;最后做括号外的2 次加法,用10~11 表示。 流水线时空图如下: 4、2 在一个5 段的流水线处理机上需经9Δt 才能完成一个任务,各段执行时间均为Δt,任务处理过程对各段使用时间的预约表如下表所示。 (1)画出流水线的状态有向图,并由状态图得出流水线的最优调度策略和最大吞吐率。 (2)按最优调度策略输入6 个任务,求流水线的实际吞吐率、加速比和效率 C0= ,然后运算 状态有向图: 最优调度策略是(2, 5),流水线的最大吞吐率就是最优调度策略的最大吞吐率,有TPmax=1/3.5Δt E=6*11/5*125=0.528 4、3设有一台时钟频率为f =200MHz 的向量流水处理机,其中,向量加流水处理部件完成一次加运算需要6 个时钟周期,向量乘流水处理部件完成一次乘运算需要7个时钟周期,访存流水处理部件对存储器读/写一个数据需要12 个时钟周期,所有流水处理部件对向量元素的处理需要1 个时钟周期。V 为向量寄存器,S 为标量寄存器,向量长度为n。处理机执行下述向量指令序列: V1 ←存储器 V2 ←V1×S V3 ←存储器 V4 ←V2+V3 存储器←V4 (1)处理机顺序执行各向量指令且不链接,若n=64,计算处理机的执行时间。 (2)若向量元素都是浮点数,计算处理机执行该指令序列的MFLOPS 速率。 (3)若指令序列在标量处理机上以顺序方式执行,忽略向量横向处理的循环控制等时间开销,计算标量处理机的执行时间,并计算向量流水处理机相对标量处理机的加速比。 Δt=187×10–8 s 2、MFLOPS=2*64/(187*10–8 s*106 ) = 68 3、5 条向量指令在标量处理机上以顺序方式处理,各自需要的处理时间分别为: T1 = 64×12Δt = 768Δt T2 = 64×7Δt = 448Δt T3 = 64 ×12Δt = 768Δt T4 = 64 × 6Δt = 384Δt T5 = 64 ×12Δt = 768Δt 标量处理机顺序执行所需要的时间为: T=T1+T2+T3+T4+T5 =3136Δt=3136×5×10–9 s =1568×10–8 s 加速比为:Sp=1568×10–8 /187×10–8 =8.39 4、4 设向量流水处理机向量长度均为32,S 为标量寄存器,V 为向量寄存器。设启动功能部件(包括存储器)需要时间Δt,一个数据打入寄存器需要时间Δt,从存储器读/写一个数据需要时间6Δt,完成一对数据的加运算需要时间6Δt,完成一对数据的乘运算需要时间7Δt。 问下列各指令组中,哪些指令可以同时并行?哪些指令可以链接?分别计算各指令组的执行时间。 Δt 2、1,2,3Δt 3、1,2并行,然后与3,4链接 1+6+1+1+7+1+1+6+1+32-1=56Δt 4、1,2链接,然后3,然后4串行1+6+1+1+6+1+32-1+1+7+1+32-1 +1+7+1+32-1=127Δt poverty. In the area of poverty alleviation, to rely on e-commerce business park, active docking Alibaba group rural treasure, the stars plan and featured the Museum project to accelerate the implementation of electronic commerce hundred thousand rural village project, free train operation sta

文档评论(0)

kri234 + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档