- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
COMA模型 只用高速缓存的存储器结构-COMA模型(COMA-Cache Only Memory Architecture) COMA模型是NUMA模型的一种特例。由全部高速缓存组成全局地址空间,访问远程缓存是通过分布在各处理机上的高速缓存目录来进行的。 分布存储型 (1)系统由多个结点(由处理机、本地存储器、I/O设备组成的自治的计算机)通过消息传递网络互相连接。 2。消息传递型 第一代(1983-1987)基于处理机板技术,采用超立方体结构和软件控制的消息交换方法。(Intel Ipsc/1) 第二代(1988-1992)用网络连结的系统结构、硬件消息寻径、中粒度分布计算的软件环境。(Intel Paragon) 第三代(1993- )处理机与通信工具在同一芯片上实现的细粒度多计算环境。(MIT J-Machine) 消息传递型(cont.) 消息寻径方式 网络的流控制策略 死锁避免 虚拟通道 消息传递原语 程序分解技术 3。多向量机 向量超级计算机 向量计算机往往是在标量处理机与向量处理机的“混合物”,程序与数据由主机加载到主存储器; 全部指令由标量控制器译码,若是标量操作或程序控制操作则有标量处理机的标量功能流水线执行; 若是向量操作则送入向量控制器,由主存储器与向量功能流水线执行向量数据流。 4。SIMD超级计算机 SIMD计算机的操作模型可以用五元组表示: M=(N,C,I,M,R) 式中: N:机器的处理单元(PE-Processor Element)数 C:由控制部件(CU-Control Unit)直接执行的指令集,包括标量与程序流控制指令; I:由CU广播到所有PE进行并行执行的指令集,包括算逻运算、数据寻径、屏蔽操作、PE执行的局部操作; M:屏蔽方案集,把PE划分为允许操作与禁止操作两种子集; R:数据寻径功能集,互连网络中PE间通信所需的 各种设置模式。 PRAM和VLSI模型 并行计算机的理论模型是从物理模型抽象得到的. 算法和芯片设计者利用理论模型为开发并行算法提供了一种方便的框架(无需关心实现细节或物理约束条件. 这些模型可为并行计算机求的理论性能界限或芯片制作前估算芯片区的VLSI复杂性和执行时间. 当将实际机器与联想机器(不考虑结点间通信开销)作比较时,抽象模型在分析可扩展性和可编程性方面是十分有用的. 计算机系统结构 -经典理论(2) 上海大学计算机学院 徐炜民 目录 属性 分类 并行性 多机结构 评测(专题) 发展 有人认为没有发展,其实有发展: 冯·诺依曼结构—单机 大型机—主机+终端 小型机—可移动的大型机 PC机—计算机普及、兼容(“盗版”) 多机—计算力(power) 计算机+网络 高性能—体现超计算力 高效能—功耗成为主要指标 冠以“计算”—网格计算、云计算、网络计算、透明计算。。。 发展 目前,衡量超级计算(supercomputing)仍用习惯的方法(小时、作业、程序数、程序可移植性) 采用共享存储器的向量多处理器系统仍是主流(Cray Research, Fujitsu, IBM, Hitachi, NEC)。例如,1993年的C90用 16台处理器,Gigaflops=1610,9,500次/美元。 九十年代,RISC标量处理机可达5000次/美元。基于消息传递的多计算机系统可达到Teraflops。 值得注意:新的体系结构IBM的“cell”处理机(流媒体)、GPU(SIMD)、ASIC/FPGA… 从广义上讲,可扩展性反映了系统结构、算法、软件和环境之间的相互关系。它涉及到系统结构的通用性、可扩展性、可编程性、可实现性。 性能的系统属性 理想的计算机系统的性能要求机器功能和程序行为之间有良好的匹配。 机器功能:好的硬件技术、改进的系统结构特性、有效的资源管理… 程序行为:难预测,与应用和运行条件有密切的关系。如算法设计、数据结构、语言效率、程序员的技能、编译技术… ?性能的系统属性(cont.) 由于机器性能会随程序而变化,因此,应该在一定范围内或按调和分布来描述性能。 描述性能的一些术语和公式: 时钟频率: CPU是由一个恒定周期(τ,以ns表示)的时钟驱动。周期的倒数是时钟频率 f=1/τ,以MHz表示 CPI (Cycle Per Instruction) :一条指令的周期数。不针对某类指令,则表示给定的指令系统和综合程序的平均值。 ?性能的系统属性(cont.) 性能因子:五个Ic -已知程序的指令条数或指令计数,p -指令译码和执行所需的处理机周期数,m -所需的存储器访问次数,k -存储周期与处理机周期之比,k值与存储器技术
文档评论(0)