精选题体系结构讲课文档.pptxVIP

下载本文档

0
0
约1.93千字
约 21页
2025-10-25 发布于河南
举报
版权申诉

精选题体系结构讲课文档.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

精选题体系结构;解：

如前所述，约75%的访存为取指令。因此，

分离Cache的总体失效率为：

(75%×0.64%)＋(25%×6.47%)＝2.10%

根据表5－4，容量为32KB的混合Cache的失

效率略低一些，只有1.99%.;平均访存时间公式可以分为指令访问和数据

访问两部分：

平均访存时间＝指令所占的百分比×

(指令命中时间＋指令失效率×失效开销)＋

数据所占的百分比×

(数据命中时间＋数据失效率×失效开销)

所以，两种结构的平均访存时间分别为：

平均访存时间分离＝75%×(1＋0.64%×50)＋

25%×(1＋6.47%×50)

＝(75%×1.32)＋(25%×4.325)

＝0.990＋1.059＝2.05;平均访存时间混合＝75%×(1＋1.99%×50)＋

25%×(1＋1＋1.99%×50)

＝(75%×1.995)＋(25%×2.995)

＝1.496＋0.749＝2.24;例5.2

我们用一个和AlphaAXP类似的机器作为

第一个例子。假设Cache失效开销为50个时钟

周期，当不考虑存储器停顿时，所有指令的

执行时间都是2.0个时钟周期，Cache的失效

率为2%，平均每条指令访存1.33次。试分析

Cache对性能的影响。;考虑Cache的失效后，性能为：

CPU时间有cache＝IC×(2.0＋(1.33×2%×50))

×时钟周期时间

＝IC×3.33×时钟周期时间;

CPU时间也增加为原来的1.67倍。但若不采用Cache,则：

CPI＝2.0+50×1.33＝68.5;考虑两种不同组织结构的Cache：直接映象

Cache和两路组相联Cache，试问它们对CPU的性

能有何影响？先求平均访存时间，然后再计算

CPU性能。分析时请用以下假设：

⑴理想Cache(命中率为100％)情况下的CPI

为2.0，时钟周期为2ns，平均每条指令

访存1.3次。

⑵两种Cache容量均为64KB，块大小都是32

字节。;⑶图5.10说明，在组相联Cache中，我们必须增

加一个多路选择器，用于根据标识匹配结果

从相应组的块中选择所需的数据。因为CPU

的速度直接与Cache命中的速度紧密相关,所

以对于组相联Cache，由于多路选择器的存

在而使CPU的时钟周期增加到原来的1.10倍。

⑷这两种结构Cache的失效开销都??70ns。在

实际应用中，应取整为整数个时钟周期。

⑸命中时间为1个时钟周期，64KB直接映象

Cache的失效率为1.4%，相同容量的两路组

相联Cache的失效率为1.0%。;第10页，共21页。;由:

平均访存时间＝命中时间＋失效率×失效开销

得:

平均访存时间1路＝2.0＋(0.014×70)＝2.98ns

平均访存时间2路＝2.0×1.10＋(0.010×70)＝2.90ns;CPU时间1路＝IC×(2.0×2＋(1.3×0.014×70))

＝5.27×IC

CPU时间2路＝IC×(2.0×2×1.10

＋(1.3×0.010×70))

＝5.31×IC;写策略;例3.5假设某指令序列中20％的指令是Load指令，并且紧跟在Load指令之后的半数指令需要使用到载入的结果，如果这种数据相关将产生一个时钟周期的延迟。理想流水线（没有任何延迟，CPI为1）的指令执行速度要比这种真实流水线的快多少？

解：我们可以利用CPI作为衡量标准。对于真实的流水线而言，由于Load指令之后的半数指令需要暂停，所以这些被暂停指令的CPI是2。又知Load指令占全部指令的20％，所以真实流水线的实际CPI为：(0.9×1+0.1×2)=1.1，这表示理想流水线的指令执行速度是其执行速度的1.1倍。;◆并行查找的实现方法：;第16页，共21页。;◆４路组相联Cache的查找过程;◆直接映象Cache的查找过程;查找方法;◆目录表的结构;◆只需查找候选位置所对应的目录表项