体系结构一二章概念V1.0.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
体系结构一二章概念V1.0

第一章1.1计算技术的现状1.1.1 现代计算机系统组成原理:计算问题,算法和数据结构,高级语言,应用软件,操作系统,硬件结构,性能评价。1.1.2 计算机系统的层次结构:用户--建模--应用程序--高级语言--汇编语言--操作系统--机器语言--微程序--硬布线逻辑1.1.3 Micheal Flynn(1972)提出指令流、数据流和多倍性概念,把不同的计算机分为四大类:SISD(Single-Instruction Single-Data,单处理机结构)SIMD(Single-Instruction Multi-Data,带分布存储器)MISD(Multi-Instruction Single-Data,搏动式阵列)MIMD(Multi-Instruction Multi-Data,带共享存储器) 1.1.4系统属性:四个指令系统结构编译技术处理机实现和控制技术高速缓存与存储器层次结构1.1.5并行程序设计方法:有二种并行程序设计方法:隐式并行性和显式并行性。隐式并行性:常用传统的语言编程成顺序源编码,经并行编译器编译成并行目标码执行。(语言容易,编译器难)显式并行性:需要并行语言来编程,编译器仅保持并行性和把资源分配给目标机器。(语言难,编译器容易)1.2多处理机与多计算机( 结构组织模型)1.2.1共享存储型多处理机:(1)均匀存储器存取(UMA-Uniform Memory Access) UMA模型适用于多用户的一般应用和分时应用。它可以在限时应用中用来加快单个大程序的执行。所有处理器均匀(所谓均匀是指所有处理器对所有存储字具有相同的存取时间)共享物理存储器。各处理机之间的通信是通过共享存储器的共享变量来实现的。这一类多处理机由于对资源的高度共享,常称紧耦合系统(tightly coupled system)。系统互联常采用总线、交叉开关、多级网络 对称多处理机系统(symmetric multi-processor) 所有处理机都能同样访问所有外围设备;所有处理机都能同样运行执行程序,如操作系统的内核、I/O服务程序。不对称处理机系统(asymmtric multi-processor) 只有一台或一组处理机(MP主处理机)执行操作系统并操纵I/O,其余处理机(AP附属处理机)没有I/O能力(2)非均匀存储器存取NUMA模型NUMA模型的共享存储器物理上是分布在所有处理机的本地存储器上,这些存储器的集合组成全局地址空间。由于访问本地存储器快,访问远程存储器慢(经过互联网络),所以访问时间取决于存储字所在位置。(3)只用高速缓存的存储器结构COMA模型COMA模型是NUMA模型的一种特例。由全部高速缓存组成全局地址空间,访问远程缓存是通过分布在各处理机上的高速缓存目录来进行的1.2.2分布存储型多处理机(1)系统由多个结点(由处理机、本地存储器、I/O设备组成的自治的计算机)通过消息传递网络互相连接。1.3多向量机和SIMD计算机 1.3.1向量超级计算机向量计算机往往是在标量处理机与向量处理机的“混合物”,程序与数据由主机加载到主存储器;全部指令由标量控制器译码,若是标量操作或程序控制操作则有标量处理机的标量功能流水线执行;若是向量操作则送入向量控制器,由主存储器与向量功能流水线执行向量数据流。1.3.2 SIMD计算机的操作模型可以用五元组表示:M=(N,C,I,M,R)N:机器的处理单元(PE-Processor Element)数C:由控制部件(CU-Control Unit)直接执行的指令集,包括标量与程序流控制指令;I:由CU广播到所有PE进行并行执行的指令集,包括算逻运算、数据寻径、屏蔽操作、PE执行的局部操作;M:屏蔽方案集,把PE划分为允许操作与禁止操作两种子集;R:数据寻径功能集,互连网络中PE间通信所需的各种设置模式。1.4 PRAM和VLSI模型(理论模型)1.4.1并行随机存取机(RAM-Random Access Machine)时间复杂性和空间复杂性 计算机求解一个规模为s的问题的算法复杂性取决于所需的执行时间和存储空间。时间复杂性是问题规模的函数。通常考虑最坏情况下的时间复杂性。空间复杂性也是问题规模的函数。通常考虑大问题的数据存储,而程序存储和输入数据的存储一般不考虑串行复杂性:串行算法的时间复杂性并行复杂性:并行算法的时间复杂性一般认为:并行复杂性比串行复杂性低,或相近确定性算法:每个操作步骤是唯一确定的;与实际计算机上程序执行的过程是一致的。不确定性算法:目前没有这类的实际机器NPC(NP完全问题): 如果存在一多项式p(s),对任何问题规模s的时间复杂性为O(p(s)),则某算法即具有多项式复杂性。具有多项式复杂性算法的问题称为P类,能以多项式时间用不确定性算法求解的问题集称

您可能关注的文档

文档评论(0)

aena45 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档