lecture4_CUDA并行模型概要1.pptVIP

  • 5
  • 0
  • 约1.14万字
  • 约 37页
  • 2017-07-05 发布于湖北
  • 举报
lecture4_CUDA并行模型概要1

? David Kirk/NVIDIA and Wen-mei Hwu, 2007-2012 ECE408/CS483/ECE498al, University of Illinois, Urbana-Champaign 第三代- 指令的执行是并行的 例代码1: c = b + a; d = c + e; 例代码2: a = b + c; d = e + f; 指令级并行的历史 非可并行的 可并行的 指令级并行的历史(续) ILP的两种形式: 超标量: 在运行时,同一时间执行 fetch, decode, 和execute 多个指令。执行可能发生混乱。 超长指令字: 在一个编译时间,将多个独立指令打包成一个长指令,处理这个长指令如同一个原子单元。 Cycle 1 2 3 4 5 Instruction1 Fetch Decode Execute Memory ? Instruction2 Fetch Decode Execute Memory Instruction3 Fetch Decode Execute Memory Instruction4 Fetch Decode Execute Memory 指令级并行的历史(续) 第四代– 多线程: 多个线程在同一个处理器(核)中交替执行 第五代- 多核: 在多个处理核上同时执行多个线程 透明的可扩展

文档评论(0)

1亿VIP精品文档

相关文档