- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GPU开发和CUDA编程介绍
CPU中利用三层循环实现矩阵乘法代码 GPU中利用每个线程计算一个元素 每个线程每次计算的数据直接从全局存储器读取 无分块矩阵乘法代码,不使用共享存储器 GPU中实现矩阵乘法的核函数代码: CPU和GPU的矩阵乘法时间比较 CPU:Quad2 Q8400 GPU:GeForce GTX460 易学 易用 高度并行化 可扩展 数据传输 和CPU交互 优化及调试 仅限于N卡 CUDA? OpenCL? 谢谢! /info/4259.html /chinqt/archive/2007/05/17/118027.html /170/1705887.html / /sites/shuxue/pcC.jsp?contentId=2574650376854 ——林英展 GPU是什么? 为什么使用GPU? GPU在通用计算上的应用 GPU的整体架构 GPU编程的优缺点 GPU的未来 Graphic Processing Unit:图形处理器,显卡的处理核心 NVIDIA公司在1999年发布Geforce 256图形处理芯片时首先提出GPU的概念,随后大量复杂的应用需求促使整个产业蓬勃发展至今。 Geforce 256之所以被称作GPU原因就在于Geforce 256划时代的在图形芯片内部集成了TL(几何光照转换)功能,使得GPU拥有初步的几何处理能力,彻底解决了当时众多游戏瓶颈发生在CPU几何吞吐量不够的瓶颈。 第一代GPU(1999年之前): 部分功能从CPU分离,实现硬件加速, GE(Geometry Engine)为代表,只能起到3D图像处理的加速作用,不具有软件编程特性 第二代GPU(1999-2002年): 进一步硬件加速和有限的编程性 1999年NVIDIA GeForce 256将TL(Transform and Lighting)等功能从 CPU分离出来,实现了快速变换 2001年NVIDIA和ATI分别推出的GeForce3和Radeon 8500,图形硬件的流水线被定义为流处理器,出现了顶点级可编程性,同时像素级也具有有限的编程性,但GPU的编程性仍然比较有限 第三代GPU(2002年之后): 2006年NVIDIA推出了CUDA(Computer Unified Device Architecture,统一计算架构)编程环境 GPU通用计算编程的复杂性大幅度降低 GPU已演化为一个新型可编程高性能并行计算资源,全面开启面向通用计算的新时代 1:强大的处理能力 2:高显存带宽 HPC Top500 List 中国HPC Top100 List 工业设计 医学研究 石油勘探 物理学研究 … 和CPU相比,GPU具有更多的计算单元,但对于复杂控制过程的处理能力则比CPU差→GPU更适用于同时进行大量简单的统一操作 基本硬件架构: 流多处理器(Stream Multiprocessor) 流处理器(Stream Processor) 共享内存(Shared Memory) 板载显存(Device Memory) Tesla Fermi 高度并行 处理速度 传输带宽 可扩展性 算法设计 编程实现 程序优化 程序调试 融合? 整合? Intel和AMD都计划在未来的CPU中集成北桥功能和GPU模块,这会给NVIDIA带来什么影响? GPU生来就是做图形计算的,不是和CPU竞争的,二者应当肩并肩生存。CUDA技术不是让GPU取代CPU的。我相信GPU不需要集成不同类型的核心。 CUDA是什么? CUDA的使用 CUDA编程算法实例 CUDA编程的优缺点 CUDA的未来 Compute Unified Device Architecture:统一计算设备架构,是由NVIDIA推出的通用并行计算架构(2006年11月第一颗基于CUDA架构的GPU,2007年CUDA C语言发布) 一种可扩展的编程模型 GPU中的并行层次 网格中块的并行,blockIdx,全局存储器通信; 同一块里的线程的并行,threadIdx,全局存储器、共享存储器通信。 GPU内线程分布结构 在CUDA中,采用SIMT(Single Instruction,Multiple Thread)的执行方式 一种异构多核的并行编程模型 CPU的控制流程 CPU控制整个程序的运行过程 在需要并行计算时候将数据传入GPU 从GPU得到计算结果继续执行程序 GP
您可能关注的文档
最近下载
- 特种设备作业人员监督管理办法课件.pptx VIP
- “十五五”研究系列:“十五五”前瞻初探.docx VIP
- 时间线时间轴流程图大事记商务版PPT模板合集.pptx VIP
- 2024年儿科急救知识竞赛试题库及答案(精华版).pptx VIP
- 银河证券“十五五”规划展望系列:“十五五”时期投资机遇前瞻【25年9月】.pdf VIP
- 2025年政府采购基础知识练习试题含答案.docx VIP
- 2025年儿科急救知识竞赛试题库及答案(一).docx VIP
- 2024年广发银行(郑州分行)校园招聘模拟试题及答案解析.docx VIP
- 9.14小数乘法计算应用题.doc VIP
- 2022年儿科急救知识竞赛试题库及答案(超强) .pdf VIP
文档评论(0)