计算机系统结构第五章课后习题答案——武汉大学出版社.docVIP

计算机系统结构第五章课后习题答案——武汉大学出版社.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

PAGE

PAGE4

计算机系统结构第5章作业解答

第2题

解:

(1)顺序执行需要的时间如下:

(2)取指令和执行重叠,即一次重叠执行方式,我们假设第n+1条指令的取指令和第n条指令的执行同时结束,那么所需要的时间为:

取指分析执行

取指分析执行

取指分析执行

取指分析执行(3)取指令、分析和执行重叠

取指分析执行

取指分析执行

取指分析执行

(4)先行控制方式

取指分析执行

取指分析执行

取指分析执行

取指分析执行

第4题

解:

K与K+1之间存在寄存器R1先写后读相关(RAW);

K+1与K+2之间存在寄存器R0写与写相关(WAW);

K与K+1之间存在寄存器R0先读后写相关(WAR)。

前二种相关会引起流水线的停顿。

流水线完成这三条指令的时空图如下。共用了9个时钟周期。

IF

IF

ID

M1

M2

IF

ID

U1

U2

U3

U4

IF

ID

A1

A2

A3

读R0

写R1

读R1、R2

写R0

读R2、R3

写R0

K

K+1

K+2

1

2

5

7

6

4

8

9

10

11

第6题

[分析]为了减少运算过程中的操作数相关,A*B*C*D应改为采用((A*B)*(C*D))的算法步骤进行运算。

[解答]按图(A)组织,实现A*B*C*D的时空关系如下图(A)所示。

输出13

输出

13

输入

A

B

C

D

A*B

C*D

A*B

C*D

A*B*C*D

规格化

尾乘

阶加

(A)

吞吐率TP=3/(13⊿t)

效率E=(3×5⊿t)/(3×13⊿t)=5/13

规格化

规格化

尾乘3

尾乘2

尾乘1

阶加

11

输入

输出

A

B

C

D

A*B

C*D

A*B

C*D

A*B*C*D

(A)

图(B)

流水线按图(B)组织时,实现A*B*C*D的时空关系如图(B)

吞吐率TP=3/(11⊿t)

效率E=(3×5⊿t)/(5×11⊿t)=3/11

第8题

解:(1)流水线时空图如下:

1

1

2

3

4

5

6

m

10

18

26τ

第11题

解:禁止表F={1,3,4,8};原始冲突向量C=;状态转移图如下:100011012

5,7

5,76

5,7

6

调度方案

平均延时

(2,5)

3.5

(2,7)

4.5

(6,5)

5.5

(6,7)

6.5

(5,6)

5.5

(5)

5

(6)

6

(7)

7

(注:可以不全部列出所有调度方案,但平均延时最小的调度方案必须写出)

最佳调度方案(2,5)下的最小平均延时为3.5拍。最大吞吐率为:TPmax=1/[3.5(拍)]。

当按(2,5)方案输入8个任务时的实际吞吐率为:

第13题

解:

A机的CPI为4(时钟周期为1/25=40ns,4CPI=160ns),B机的CPI为1(时钟周期为1/20=50ns)

B机对A机的加速比S=160/50=3.2

(2)A机的MIPS=25/4=6.25

B机的MIPS=20/1=20

第17题

解:

三条指令可并行执行。T=1+7+1+64-1=72(拍)。

前二条指令可并行执行,第三条指令只能串行执行。因为前二条指令的执行时间不等。T=(1+7+1+63)+(1+6+1+63)=143(拍)。

如果能控制第一条指令较第二条指令提前一拍启动,则可以实现与第三条指令间的链接,这时的执行时间为:T=(1+7+1+1+6+1)+63=80(拍)。

4条指令的串行执行时间为:T=(8+63)+(9+63)+(8+63)+(8+63)=285(拍)。

如果能够控制存储器中的第一个分量元素到达V0直至乘法部件的时间,与V1中的第一个分量元素到达乘法部件的时间相等,则前二条指令间可以链接。这样,执行时间为:T=(8+9+63)+142=222(拍)。第三条指令与第二条指令存在着先写后读相关,第四条指令与第三条指令也存在着先写后读相关,但它们都可链接执行。这四条指令总执行时间为:T=(8+9+8+8)+63=96(拍)。

(4)条件同(3),4条指令实现链接的时间为:T=(8+16+9+8)+63=104(拍)。

您可能关注的文档

文档评论(0)

186****9620 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档