体系结构复习纲要.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
按照flynn分类法。P 2 根据指令和数据流概念提出了不同计算机系统结构的分类法。SISD传统顺序及。向量计算机用标量和向量硬件装备,或者以SIMD机的形式出现。并行计算机一般属于MIMD机。 MISD,执行不同的指令的时候,同一数据流通过处理机线性阵列。这种系统结构师流水线执行特定算法的波动阵列 提高微处理器性能的主要措施,理解其原理。P 5 (1)提高主频:提高性能的最直接的方法。可以通过细化流水线。增加流水级数实现。但是往往会受到存储性能的限制。 (2)多线程:可以隐藏访存延迟,是提高系统吞吐率的有效方法。 (3)2Bump技术:脉冲上升沿和下降沿都进行信息的传送和接受,将频率提高两倍 (4)提高IPC:每拍并行流出多条指令是标量处理器中多个功能部件并行工作 (4)提供IPC的方法:超标量、超流水、超长指令字 (5)合理分配软硬件功能:不经常使用的功能交由软件完成,经常使用的功能交由硬件完成。 (6)优化片内cache (7)加大通用存储器 (8)无序流出/乱序执行:不相关的指令中,后面的指令可以提前流出,提高IPC;无资源冲突的指令可以提前执行,减少功能部件和寄存器的空闲,提高计算速度。 (9)预取:指令中增加具有按时功能的指令,提示硬件提前执行加载指令,隐藏访存的延迟 (10)分支预测:硬件动态预测和软件静态预测。基于程序分支的历史记录来预测未来分支的趋势。 设置踪迹缓存,记录程序执行的动态指令序列。 可以通过改进编译器方式实现并行,编译器的改进方法 编译器支持---改进编译器的三种方式 预处理程序:采用顺序编译器和目标计算机的底层程序库实现高级并行 预编译器:程序流优化、相关性检查和有限的优化来检测并行性 第三种:开发一种新的,并行化向量化的编译器。能自动检测目标代码的并行性,并将顺序结构转化为并行结构。但是现代的编译器无法检测所有的并行并自动进行需要用户显示表达编译 共享存储型多处理机的模型:三种 UMA—均匀存储器存取 NUMA---非均匀存储器存取 COMA—只有高速缓存的存储器结构 给出程序及相关条件,分析程序在多机系统上的运行时间。 分析程序在并行随机存取机上运行的时间复杂性。 程序的并行性,并行度。P 17 三种加速比模型:固定时间、固定负载和固定存储加速比模型 1固定负载加速比中,我们发现只要增加并行工作的工作量。比如我们把并行工作的工作量增大P倍,则加速比工作可以转化为 我们可以发现,当并行工作量增加P倍的时候,在P台处理机上执行的时间和在一台处理机上执行的时间相同。 2固定时间加速比: 3在多机系统中,处理机数扩展至P倍,系统的存储能力也应该做相应的增加。对于有些空间复杂性低于时间复杂性的科学计算问题,系统存储容量的增大,可支持更大的并行工作量的增加,增加的倍数为G(p)倍(G(P)=P)。G(P)受限于存储器的容量。则得到如下加速比公式 给出程序,并给出不同粒度划分和处理机数目,求解调度方案。 并行系统的效率、可扩展性、冗余度、利用率和质量. P 25 加速比S(P)的最大值,应该是系统的结点数P。实际受到串行瓶颈、负载不平衡、同步和通信开销等问题,实际S(p)P。为了表征并行系统加速比接近P的程序,用效率E(P)进行描述。 E(P) = S(p)/P。E(p) 越大系统可扩展性越好。并行性好的系统,加速比应随并行度的增加而线性增加,或者效率随并行度的增加而保持常数。我们用C(P)来表示可扩展性。 C(P)=E(P)/E’(P),其中E’(P)是忽略了并行开销时的系统效率。 C(P)= E(P)/E’(P)= S(P)/S’(P)=1/[1+O(P)/T(P)] C(P)值越大系统可扩展性越好。 这里的O(P)是总的并行开销,包括同步和通信开销。 解释流水线中加入站寄存器之后存在的穿透现象。 流水线的分类:单功能与多功能,动态与静态 单功能 只能完成一种固定功能的流水线。 多功能 流水线的各段通过不同连接实现不同功能 静态流水线:同一段时间内,各个功能段只能按照一种方式连接,实现一种固定的功能。 动态流水线:在同一段时间内,各段可以按照不同的方式连接,同时执行多种功能。 单功能流水线的吞吐率、加速比和效率的分析 例: 用一条4段浮点加法器流水线求8个浮点数的和: Z=A+B+C+D+E+F+G+H 给出非线性流水线的预约表,求解相关内容 P 50 静态分支预测技术常采用的方法:三种的原理 转移预测的方向是确定的,或者预测转移不成功,或者预测转移成功, 在程序实际执行过程中,转移预测的方向不能改变。 静态转移预测可以只用软件实现,也可用硬件来实现,还可以在转移的两个方向上都预取指令。 超标量处理机、超流水线处理机和超标量超流水线处理机,三种处理剂现对于单流水线的

文档评论(0)

kxiachiq + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档