Intel现代CPU结构与技术课件.pptVIP

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Intel现代CPU结构与技术课件.ppt

◇结构特征: *哈佛结构—I-Cache、D-Cache分离(Pentium已有) *双独立总线(DIB)结构—MEM总线与L2 Cache总线并行 *动态执行技术—由多路分支预测、数据流分析、推测执行3大技术组成 *超标量流水结构—3路超标量、12级流水结构 转下页 一、PⅢ CPU结构特征 回28页 回37页 精选 回上页 回37页 回39页 回44页 ITLB L1 I-Cache 预取Buffer/预译码 指令预取单元 译码器0 uCode ROM uop Buffer RAT/分配器 再定序缓冲器ROB(40项) 保留站RS L2 Cache DTLB L1 D-Cache MOB Load Addr 复杂 ALU FPU MMX ALU MMX乘法 BIU 4uop RRF 简单 ALU JEU Port0 MEM 译码器1 译码器2 前端 总线 后端 总线 PⅢ(P6核心)内部结构图 1uop 1uop 3uop 3uop 3uop 3uop Port1 MMX ALU MMX移位 Store Addr Store Data Port4 Port3 Port2 64bit 64bit 64bit 64bit 回下页 回36页 精选 CPU Core L1 I-Cache L1 D-Cache L2 Cache Cache 控制器 阵列 Cache总线 BIU 主存 MEM 控制器 阵列 MEM总线 ◇Pentium的Cache结构:贯通式Cache(不命中时再访问主存) TCPU访存命中Cache =TMEM地址→Cache地址变换+TCache阵列 TCPU访存不命中Cache=TMEM地址→Cache地址变换+TMEM阵列+TCache阵列 ◇PⅢ的Cache结构:DIB结构的Cache(BIU以2种频率同时访问) TCPU访存命中Cache =TMEM地址→Cache地址变换+TCache阵列 TCPU访存不命中Cache=TMEM阵列 CPU Core L1 I-Cache L1 D-Cache L2 Cache Cache 控制器 阵列 后端总线 BIU 主存 MEM 控制器 阵列 前端总线(MEM总线) Cache命中 二、PⅢ CPU的双独立总线(DIB)结构 转上页 精选 三、PⅢ CPU的动态执行技术 1、多路分支预测技术 ◇基本原理(回顾): *指令预取时—用指令地址查BTB命中时,采用动态预测法预取后继指令 *指令译码时—对BTB不命中的转移指令,采用静态预测法预测,预测为转移时进行误预测处理 *指令执行完成时—更新转移指令的转移历史, 误预测时需进行相应处理 即可以对分支指令(转移指令)的多个历史模式进行预测,是Pentium分支预测技术的发展 转25页(3点) 转22页(预测过程) 精选 2、数据流分析技术—乱序执行技术 (1)乱序执行思想 取指 流水线例: 译码 取数 执行 写回 ◇乱序执行思想:用指令窗口按序保存多条指令; 优先执行操作数就绪的指令(数据流技术) Cache或主存 ALUs (一条I) 译码器 (一条I) 寄存器组 按序 取指部件 取数部件 存数部件 PC 按序 指缓 (多条I) 按序流水过程: Cache或主存 ALUs (一条I) 译码器 (一条I) 寄存器组 按序 取指部件 取数部件 存数部件 PC 乱序 指令缓 (多条I) 指令窗口 (多条I) 操作数就绪的指令 取数缓(多个D) 存数缓 (多个D) 转4页(PC及指令格式) 回下页 精选 (2)分布式动态调度技术(Tomasulo算法) 核心是用寄存器重命名方法解决RAW、WAR、WAW相关 ◇分布式动态调度思想:--即调度机制分散在各部件中 ①指令放入保留站RS、指令数据需求放入相应部件 指令间数据关系→部件间关系 ②各部件独立控制数据输入/输出(数据就绪时) 转上页 回下页 回35页 Cache或主存 控制 ALUs (一条I) 指令缓冲器 (多条I) 译码器 (一条I) 保留站RS (多条I) 存数缓冲器SDB 寄存器组 FLR (按序) (按序) (乱序) 取指部件 控制 控制 控制 取数缓冲器FLB 取数部件 存数部件 CDB 源地址 目的地址 PC 精选 ◇分布式动态调度C

文档评论(0)

liuxiaoyu99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档