- 3
- 0
- 约1.71万字
- 约 73页
- 2017-01-01 发布于北京
- 举报
《2.[GPU计算]CUDA基本介绍
CUDA基本介绍 基于Nvidia GPU的通用计算开发 张舒 电子科技大学 电子工程学院 06级硕士研究生 信号探测与获取技术专业 研究方向:合成孔径雷达成像与雷达目标像识别 信号处理与模式识别的算法与硬件实现研究 GPU的优势 强大的处理能力 GPU接近1Tflops/s 高带宽 140GB/s 低成本 Gflop/$和Gflops/w高于CPU 当前世界超级计算机五百强的入门门槛为12Tflops/s 一个三节点,每节点4GPU的集群,总处理能力就超过12Tflops/s,如果使用GTX280只需10万元左右,使用专用的Tesla也只需20万左右 GPU /CPU计算能力比较 GPU/CPU存储器带宽比较 GPU/CPU架构比较 延迟与吞吐量 CPU: 通过大的缓存保证线程访问内存的低延迟,但内存带宽小,执行单元太少,数据吞吐量小 需要硬件机制保证缓存命中率和数据一致性 GPU: 高显存带宽和很强的处理能力提供了很大的数据吞吐量 缓存不检查数据一致性 直接访问显存延时可达数百乃至上千时钟周期 单核CPU已经走到了尽头 频率提高遇到了瓶颈 从p4时代至今主流处理器频率一直在2GHz-3GHz左右 架构上已无潜力可挖。超线程 多流水线 复杂的分支预测 大缓存等技术已经将性能发挥到了极致,但是通用计算中的指令级并行仍然偏低 上述技术占用了芯
您可能关注的文档
- 《2.Upselling Skills.ppt
- 《2.VB 选择结构.ppt
- 《2.unit3 语法.ppt
- 《2.VA_cost_cal.ppt
- 《2.VB课件.ppt
- 《2.VC2222—创业投资概念与发展.ppt
- 《2.VB-第1章.ppt
- 《2.VC3.ppt
- 《2.UPS基本原理.ppt
- 《2.VIN码及相关知识培训.ppt
- 2026年智慧健康管理系统创新报告.docx
- 河北衡水市武强中学2025-2026学年高二下学期4月期中物理试题(含解析).docx
- 2026年人工智能行业智能老年防走失定位器创新报告.docx
- 2026年低空经济飞行器量子技术应用创新报告.docx
- 2026年农业智能农业智能育种创新报告.docx
- 河北省保定市莲池区保定市第一中学2025-2026学年高二下学期期中考试生物试题(含解析).docx
- 2026年智慧城市电子站牌充电创新报告.docx
- 河北省邯郸市平恩中学等校2025-2026学年八年级期中考试英语试题(含解析).docx
- 2026年供应链创新技术应用报告.docx
- 2026年体育智能赛事管理系统支付系统创新报告.docx
原创力文档

文档评论(0)