高等计算机系统结构讲义.ppt

互联网服务提供方 服务网格 Virtualization of services Dynamic service provisioning Self-healing of services Integratable with Enterprise applications 企业间及合作伙伴 合作网格 DOE, UK Grid DoD 协同共享 公用的数据中心 动态的提供资源 企业内部 网格及其三个阶段 time 共享程度 企业网格 Toshiba, TI, GM Cluster-to-cluster sharing management Reliable file transfer staging User account mapping, Firewalls, Kerboros 1996 2000 2004 2008 网格应用的挑战 计算机制造业 机械制造业 Project fairshare flexible lease 适度的规模 本地管理 Clearcase sup NFS load balance WAN file sync Optimal use WAN lic sharing Borrow / Reclaim Service domains 生命科学 可靠文件传输 PDM 集成 自动的工具 最佳的应用 Data source sync Data set lifecycle Data Cache Data Pipeline Workflow mgmt Capacity workload Large number of jobs 政府与教育 Efficient xfer data replication NUMA Co-alloc Advance Rsv 金融 Workflow business unit silos Deadline Messaging data caching 计算机 数据 软件 程序和数据从Host进入主机 指令先在Scalar control unit译码,如是标量或控制操作指令,则在标量功能流水部件种执行。如果是向量指令,则进入向量控制部件。 register-to-register: Cray series Fujitsu VP2000 series memory-to-memory: Cyber 205 向量化。 多向量机发展过程: CDC7600 (CDC,1970) CDC Cyber205 (Levine,1982) Memory-Memory Cray 1 (Russell,1978) register-register ETA 10 (ETA,Inc,1989) Cray Y-MP Cray Research 1989 Fujitsu NEC Hitachi Models Cray MPP Cray Research 1993 其中: Cray Y-MP, C90: Y-MP有2,4,8个处理器,而C90有16个处理单元(PE),处理速度16GFlops。 Convex C3800 family: 8个处理器,4GB主存储器, Rerkperformance 为2GFlops。 1.3.2 SIMD计算机 SIMD计算机的结构如下图: Control Unit Proc 0 Mem 0 Proc 1 Mem 1 …… Proc N-1 Mem N-1 PE0 PE1 PE N-1 InterConnection Network MasPar MP-1: 可有1024,4096,…,16384个处理器。在16K PEs,32位整数运算,16KB局部存储器模块的配置下,可达26000MIPS,单精度浮点运算1.5GFlops,双精度浮点运算650MFlops。 CM-2: 65536个处理单元,1Mbit/PE。 峰值速率为28GFlops,持续速率5.6GFlops。 SIMD计算机发展过程图如下: Illiac IV (1968) GoodYear MPP (1980) BSP (1982) MasPar MP1 (1990) IBM GF/11 (1985) DAP 610 (AMT,Inc.1987) CM2 (1990) CM5 (1991) 1.3.3 Shared-Memory Multiprocessors UMA(Uniform-memory-access) model: 物理存储器被所有处理机均匀共享,所有处理

文档评论(0)

1亿VIP精品文档

相关文档