- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
安腾高性能处理机体系结构.ppt
10.4指令级并行机制 3、推断执行的实现 例2考察下面的一个典型的if-then-else结构:If (x=0) then m=m+1 else m=m-1 在传统的超标量流水线体系结构中,完成上述判断通常要首先安排一条比较语句,将x与0进行比较。得到比较结果后,再选择执行then分支或else分支。 相应的汇编语句大致如下所示:cmp x,0;比较x和0je L1;若相等则转移至标号L1sub m,1;m=m-1jmp L2;无条件转移至标号L2L1:add m,1;m=m+lL2: 10.4指令级并行机制例2续 而安腾处理机可以通过编译优化消除条件语句中的分支指令,将该结构转化成顺序的推测执行结构:①cmpeq P1,P2=0,x;//无条件执行:将r4寄存器的值与0比较,若相等则置推断寄存器P1为1,P2为0,否则置推断寄存器P1为0,P2为1 ②(P1)add m=1,m //若P1为1,则m+1送m③(P2)add m=-1,m //若P2为1,则m-1送m从判定流程上,似乎上面的三条语句并没有从逻辑上改变if-then-else结构的执行过程。但如果我们能够把这个例子和安腾体系结构结合起来,还是可以从这个简单的例子中体会到安腾处理机的设计思想。 10.4指令级并行机制 4、安腾处理机设计思想 首先,安腾指令系统中的每条指令都能够支持推断执行,所以第二条指令和第三条指令中的条件判断并不需要使用专门的判断指令。虽然后面两条指令是条件执行的,但整体条件判断结构不再需要分支指令。 其次,指令中的推断操作的安排是由编译器在编译过程中完成的,不需要处理机在执行指令的非常短的时间内动态安排各条指令的条件执行。 最后,每条指令中虽然可以指定推断寄存器,但取指令、指令译码和执行操作并不需要等到推断寄存器的取值确定后再进行。 10.4指令级并行机制 二、推测技术 1、存储器访问延迟与指令级并行 在现代计算机体系结构中,多级存储体系能够有效提高存储系统的性能价格比。但是,在多个功能单元实现并行处理的处理机中,执行指令的速度仍然受到存储器访问速度的制约。 现代RISC处理机用专用指令访问内存,取数指令往往成为影响处理机性能的瓶颈。见下图看一下取数指令对处理机并行执行指令的影响。 10.4指令级并行机制 2、控制推测 解决处理机访存延迟的办法就是将访存操作尽可能提前执行。 在安腾处理机中,控制推测技术用于解决上述与取数指令有关的控制相关问题。 10.4指令级并行机制 3、数据推测 控制推测技术能够解决分支和取数操作中的控制相关,但在指令优化过程中还可能存在数据相关。 10.5双核安腾处理机的组成 一、双核安腾处理机的基本特性 1、并行处理技术 2、显式并行指令计算技术 3、超线程技术 4、三级大容量高速缓冲存储器 5、硬件辅助虚拟化技术 6、高速缓存安全技术 虚拟化技术 所谓虚拟化,是指用单个处理机模拟多个处理机并行工作,而每个处理机都可以被看作一个独立的工作环境,从而在一个平台上同时运行多个操作系统,并且每一个操作系统中都有多个程序运行。应用程序在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。 返回 超线程技术1/2 在双核安腾处理机中,英特尔首次把在奔腾4处理机中采用的超线程(Hyper Threading)技术引进到安腾处理器家族中,每个处理机支持四个线程,使其能够处理的应用线程数是早期单核产品的四倍。 超线程技术2/2 超线程技术在一颗处理机芯片内设计多个逻辑上的处理机内核,这些逻辑上的内核共享处理机内的整数运算单元、浮点运算单元和二级cache等资源,但却被模拟成多个物理内核芯片。从软件的角度看,系统中好像存在多个独立的处理机内核,因而可以让单个处理机在线程级实现并行计算,支持多线程的操作系统和应用软件。但核心硬件资源实际上只有一套,故当多个线程同时访问某一个资源时,其中一个线程要暂时停止并让出资源,直到这些资源闲置后才能继续执行。 10.5双核安腾处理机的组成 二、双核安腾处理机的组织结构 1、指令执行单元 2、处理机流水线 3、cache组织 4、双核仲裁 本 章 小 结 英特尔和惠普合作开发了取代IA32体系结构的64位安腾体系结构。安腾计算机体系结构是64位高性能计算环境中的主流体系结构之一。这一体系结构吸收了以往的先进处理机体系结构的优点,通过提高指令执行的并行性,增强了系统整体的计算性能。 安腾体系结构的核心是显式并行指令计算(EPIC)技术。通过精心设计的基于超长指令字技术的指令系统,EPIC编译器能够把在编译过程中发现的并行性
您可能关注的文档
- 国家图书馆海外学文献研究中心规划.ppt
- 国家建设高水平大学 —公派研究生项目 (联合培养博士研究 .ppt
- 2007年深圳金融调控与监管的重点工作及成效.doc
- AS—AD模型.ppt
- C程序流程设计 - 深圳职业技术学院-精品课程中心- ….ppt
- Linux存储管理 - 烟台大学计算机与控制工程学院.doc
- 国家网格 (China National Grid - CNGrid) 运行管理中心.ppt
- TD-SCDMA - 马鞍山职业与成人教育网.ppt
- WinInet与网络协议实现.doc
- 一元线性回归 - 欢迎访问安徽工业大学门户网站!.doc
- 2024高考物理一轮复习规范演练7共点力的平衡含解析新人教版.doc
- 高中语文第5课苏轼词两首学案3新人教版必修4.doc
- 2024_2025学年高中英语课时分层作业9Unit3LifeinthefutureSectionⅢⅣ含解析新人教版必修5.doc
- 2024_2025学年新教材高中英语模块素养检测含解析译林版必修第一册.doc
- 2024_2025学年新教材高中英语单元综合检测5含解析外研版选择性必修第一册.doc
- 2024高考政治一轮复习第1单元生活与消费第三课多彩的消费练习含解析新人教版必修1.doc
- 2024_2025学年新教材高中英语WELCOMEUNITSectionⅡReadingandThi.doc
- 2024_2025学年高中历史专题九当今世界政治格局的多极化趋势测评含解析人民版必修1.docx
- 2024高考生物一轮复习第9单元生物与环境第29讲生态系统的结构和功能教案.docx
- 2024_2025学年新教材高中英语UNIT5LANGUAGESAROUNDTHEWORLDSect.doc
文档评论(0)