第四章(习题).docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章(习题).doc

1. 假设一条指令的执行过程分为“取指令”、“分析”和“执行”三段,每一段的时间分别是△t、2△t和3△t。在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。 ⑴ 顺序执行方式。 ⑵ 仅“取指令”和“执行”重叠。 ⑶ “取指令”、“分析”和“执行”重叠。 一条线性流水线有4个功能段组成,每个功能段的延迟时间都相等,都为△t。开始5个任务,每间隔一个△t向流水线输入一个任务,然后停顿2个△t,如此重复。求流水线的实际吞吐率、加速比和效率。 3. 用一条5个功能段的浮点加法器流水线计算。每个功能段的延迟时间均相等,流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。要求用尽可能短的时间完成计算,画出流水线时空图,计算流水线的实际吞吐率、加速比和效率。 4. 一条线性静态多功能流水线由6个功能段组成,加法操作使用其中的1、2、3、6功能段,乘法操作使用其中的1、4、5、6功能段,每个功能段的延迟时间均相等。流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。用这条流水线计算向量点积,画出流水线时空图,计算流水线的实际吞吐率、加速比和效率。 ? 5. 一条有三个功能段的流水线如下图。每个功能段的延迟时间均相等,都为△t。其中功能段S2的输出要返回到它自己的输入端循环一次。 ⑴ 如果每间隔一个△t向流水线的输入端连续输入新任务,问这条流水线会发生什么情况? ⑵ 求这条流水线能够正常工作的最大吞吐率、加速比和效率。 ⑶ 有什么办法能够提高这条流水线的吞吐率,画出新的流水线。 6. 一条有4个功能段的非线性流水线,每个功能段的延迟时间都相等,都为20ns,它的预约表如下: 时间 流水段 1 2 3 4 5 6 7 S1 × × S2 × × S3 × S4 × × ⑴ 写出流水线的禁止向量和初始冲突向量。 ⑵ 画出调度流水线的状态图。 ⑶ 求流水线的最小启动循环和最小平均启动距离。 ⑷ 求平均启动距离最小的恒定循环。 ⑸ 求流水线的最大吞吐率。 ⑹ 按照最小启动循环连续输入10个任务,求流水线的实际吞吐率。 ⑺ 画出该流水线各功能段之间的连接图。 7. 一条由4个功能段组成的非线性流水线的预约表如下,每个功能段的延迟时间都为10ns。 时间 流水段 1 2 3 4 5 6 S1 × × S2 × × S3 × S4 × × ⑴ 写出流水线的禁止向量和初始冲突向量。 ⑵ 画出调度流水线的状态图。 ⑶ 求流水线的最小启动循环和最小平均启动距离。 ⑷ 在流水线中插入一个非计算延迟功能段后,求该流水线的最佳启动循环及其最小平均启动距离。 ⑸ 画出插入一个非计算延迟功能段后的流水线预约表(5行8列)。 ⑹ 画出插入一个非计算延迟功能段后的流水线状态变换图。 ⑺ 分别计算在插入一个非计算延迟功能段前、后的最大吞吐率。 ⑻ 如果连续输入10个任务,分别计算在插入一个非计算延迟功能段前、后的实际吞吐率。 8. 在流水线处理机中,有独立的加法操作部件和乘法操作部件各一个,加法操作部件为4段流水线,乘法操作部件6段流水线,都在第一段从通用寄存器读操作数,在最后一段把运算结果写到通用寄存器中。每段的时间长度都相等,都是一个时钟周期。每个时钟周期发出一条指令。问可能发生哪几种数据相关?写出发生相关的指令序列,分析相关发生的原因,并给出解决相关的具体办法。 9. 在下列不同结构的处理机上运行8×8的矩阵乘法C=A×B,计算所需要的最短时间。只计算乘法指令和加法指令的执行时间,不计算取操作数、数据传送和程序控制等指令的执行时间。加法部件和乘法部件的延迟时间都是3个时钟周期,另外,加法指令和乘法指令还要经过一个“取指令”和“指令译码”的时钟周期,每个时钟周期为20ns,C的初始值为“0”。各操作部件的输出端有直接数据通路连接到有关操作部件的输入端,在操作部件的输出端设置有足够容量的缓冲寄存器。 ⑴ 处理机内只有一个通用操作部件,采用顺序方式执行指令。 ⑵ 单流水线标量处理机,有一条两个功能的静态流水线,流水线每个功能段的延迟时间均为一个时钟周期,加法操作和乘法操作各经过3个功能段。 ⑶ 多操作部件处理机,处理机内有独立的乘法部件和加法部件,两个操作部件可以并行工作。只有一个指令流水线,操作部件不采用流水线结构。 ⑷ 单流水线标量处理机,处理机内有两条独立的操作流水线,流水线每个功能段的延迟时间均为一个时钟周期。 ⑸ 超标量处理机,每个时钟周期同时发射一条乘法指令和一条加法指令,处理机内有两条独立的操作流水线,流水线的每个功能段的延迟时间均为一个时钟周期。

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档