[工学]Web_信息检索pc_chap2
Chapter 2Parallel Programming Platforms Limitation of memory system performance 程序执行的效率不仅依赖于processor 的速度,也依赖内存的速度 A memory system consists of DRAM and multiple levels of catches. Example 2.2 CPU 1 GHz(109), two add units and can execute four instructions in each cycle, add time = 4 G Dram access time 100 ns (= 100 cycles), processor must wait 100 ns before it can process the data A?B= a1b1+a2b2+,…,+anbn, 实际每次取数需100ns, 实际峰值为1G/100=100M ,大大低与运算峰值。解决方法是用catch把block的数据读到快速缓存中。 Strided access 在存储空间上交叉取数据 Dichotomy(二分法) of parallel computing platforms 按控制结构分 SIMD (single instruction, multiple data stream) A singe control unit dispatches instruction to each processing units 早期采用的体系结构,典型的机器有 Illiac IV, MPP, CM-2, Pentium’SSE(streaming SIMD extensions) 为专用计算设计的, e.g., 图像处理, 排序,…, MIMD (Multiple instruction, multiple data stream) Different control unit dispatches instruction to different processing units Dichotomy of parallel computing platforms 逻辑上分:从程序设计角度,从通讯方式上分 基于信息通讯;基于共享地址空间 基于物理相互连接方式 Mesh,hypercube SIMD的特点 在同一时间,所以的处理器执行同一指令,但对应不同的数据。 The variable activity mask (0,1) is used to control a processor whether to implement the instruction or not. If the central control unit is divided into n different control units, the model becomes a MIMD (multiple instruction multiple data streams) 基于通讯Communication Model of Parallel Platforms Shared-address-space platforms Note: The address-space is shared in logic, while the term of shared memory means to chare memory by physic circuits or network, the latter is the special case of the former. Global or local Uniform memory access (UMA) Shared memory(the acces time is the same) non-uniform memory access(NUMA) Distributed shared memory Send(ID,Info); receive(ID,Info) (by message passing) Crossbar network The interconnection network consisting of the processing elements and memory bank. The switch on the nodes of network will determine if to access the data storing in the banks. The number of switches is O(pb), where p the
您可能关注的文档
- [工学]5材料力学绪论及基本概念.ppt
- [工学]51单片机汇编语言教程.pdf
- [工学]5章-精细有机合成与工艺.ppt
- [工学]5闷盖的数控车削加工.ppt
- [工学]5频谱的线性搬移电路 高频电子线路 曾兴雯 课件.ppt
- [工学]5第五章 集成触发器.ppt
- [工学]6 受压构件的截面承载力.ppt
- [工学]6 syscall1.ppt
- [工学]6 章 应用程序设计与实现技术for 40 hours.ppt
- [工学]6-函数.ppt
- 全过程工程管理造价咨询工程监理项目服务方案投标方案(技术部分).doc
- 招标代理服务投标技术服务方案(技术方案).doc
- AI大模型与AIGC技术在公安领域的应用解决方案(99页 PPT).pptx
- 工业4.0智能制造数字工厂规划方案.pptx
- 树立社会主义核心价值观.docx
- 三年(2023-2025)中考历史真题分类汇编(全国)专题21 科技文化与社会生活(解析版).docx
- 2025年中考道德与法治真题完全解读(吉林卷).pdf
- 2025年中考道德与法治真题完全解读(安徽卷).pdf
- 三年(2023-2025)中考历史真题分类汇编(全国)专题14 人民解放战争(解析版).pdf
- 三年(2023-2025)广东中考历史真题分类汇编:专题03 中国近代史(八年级上册)(解析版).docx
最近下载
- Leica_TS16_UM_v2-0-0_zh-徕卡实用说明书.pdf VIP
- 医院感染暴发控制标准2025版课件.pptx VIP
- 医学免疫学(全套课件272P)ppt课件.pptx VIP
- 古建筑安全监测技术标准.pdf VIP
- A4版2023安徽省中考数学答题卡.pdf
- Vaillant威能VIH CN 水罐参数技术参数.pdf
- 喷墨打印OLED技术全球竞争格局与发展策略.docx VIP
- 2025年9月山西医科大学附属晋中医院(晋中市第一人民医院)招聘编制外人员38人笔试模拟试题及答案解析.docx VIP
- 2025年9月山西医科大学附属晋中医院(晋中市第一人民医院)招聘编制外人员38人考试参考试题及答案解析.docx VIP
- 人教版物理8年级下册全册教学课件.pptx
原创力文档

文档评论(0)