CUDA编程优化_cuda_optimization_zyd.pptxVIP

  • 183
  • 0
  • 约1.21万字
  • 约 63页
  • 2018-02-02 发布于浙江
  • 举报
CUDA编程优化_cuda_optimization_zyd

mailto:zyddora@github.iozyddora@github.io 张也冬 2016.05.30CUDA编程优化CUDA Programming OptimizationOutlineGPUCUDAOptimizationBasic AlgorithmWhy Add GPUs? Accelerate ApplicationsCPU从 提高时钟频率 到 多核处理器加速 —— 同步多线程SMTCPU + GPU 异构高性能计算CPUs 有4, 6, 8或甚至12核单个GPU芯片也有512核高度并行化、多线程GPU将大数据在大量核上并行处理,以加速程序运行GPUWhy Add GPUs? Accelerate Applicationsvery high memory bandwidthtremendous computational horsepowerNew release – P100CPU vs. GPU: Low Latency or High Throughput?GPU数据级并行 (DLP)运算以更多的核心,突出大量多线程运算能力,弱化延迟大部分芯片面积支持运算逻辑CPU以低延迟访问缓存数据强于预测执行 (speculative execution)、乱序执行 (out-of-order)等减少每个线程内的延迟大部分芯片面积支持缓存How to implem

文档评论(0)

1亿VIP精品文档

相关文档