- 1、本文档共81页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2009多核计算29-32多核GPU
多核计算29-32课 GPU 陈天洲,施青松,胡威 {tzchen, zjsqs, ehu}@ 2010年1月13日,玉泉校区曹西101 agenda GPU架构 典型GPU架构 NviDIA GPU AMD GPU GPGPU技术 GPU编程环境 CUDA OpenCL 高性能计算中的GPU 天河一号案例分析 GPU概念 Graphic Processing Unit 早年ATI称为VPU(Visual Processing Unit) 作为图形加速单元被集成到显卡中 完成浮点操作,协同其他定制的芯片完成图形渲染中特殊的算法和操作 实现了许多图形操作中的基本操作,并且能够直接输出到显示器中 能够从硬件上支持TL(Transform and Lighting,多边形转换与光源处理)的显示芯片 TL是3D渲染中的一个重要部分,其作用是计算多边形的3D位置和处理动态光线效果,也可以称为“几何处理”。 TL是GPU的标志 软加速 2D显示芯片在处理3D图像和特效时依赖CPU处理能力 硬件加速 3D显示芯片将三维图像和特效处理功能集中在显示芯片内 GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时 GPU历史 20世纪70年代,ANTIC芯片,用硬件直接控制图形和文本。 20世纪80年代,Commodore Amiga在视频硬件嵌入了blitter(BLock Image Transger) 1991年,S3 Graphics发布了第一个单芯片2D加速器——S3 86C911 1995年,所有的PC图形芯片都集成了2D加速 20世纪90年代中期,S3 ViRGE、ATI Rage和Matrox Mystique的3D图形芯片 图形API:OpenGL,90年代初期;DirectX,90年代末期 Direct3D 7.0版本中开始支持硬件TL 1999年的GeForce 256是第一块GPU芯片 2000年以后,GPU开始增加可编程的像素渲染引擎 GeForce 3,ATI Radeon 9700 2000年,Hopf在GPU上实现小波变换 2001年,Larsen利用GPU的多纹理技术做矩阵运算 2002年,Harris在GPU上用细胞自动机(CA)仿真各种物理现象,Purcell第一次使用GPU加速光线跟踪算法 2003年,是GPU领域具有里程碑意义的一年,Kruger实现了线性代数操作;Li实现了Lattice Boltzmann的流体仿真;Lefohn实现了Level Set方法等一大批成果 2004年,Govindaraju在数据库领域应用GPU加速取得进展;商业领域,Apple推出支持GPU的视频工具 2006年,首颗DX10 GPU(GeForce 8800)诞生,GPU代替CPU进行更高效的Geometry Shader(几何着色)运算 2007年,主流DX10 GPU全面上市,CPU可不用再承担高清视频解码运算的压力,如今整合GPU都完美支持硬解码 2008年,CUDA架构初露锋芒:PhysX引擎发布,GPU代替CPU和PPU进行物理加速运算;Badaboom、TMPGEnc等软件开始利用GPU的并行计算能力来加速视频编码 2009年,CUDA、OpenCL、DX11 Compute Shader百花齐放,大批应用软件改投GPU门下,GPU已具备取代CPU进行并行计算的能力 形态 独立显卡 集成显卡/主板集成芯片 一般不能很好处理3D图形 GPU和CPU共用系统RAM,两者存在一定的竞争,但一般GPU的访问带宽会根据系统配置自动调节 混合方式 共享系统的RAM,但同时也具有一个较小的专有RAM,它能够弥补系统RAM的延时问题 集成到CPU中 2009年1月AMD公司 “Yukon” ,微处理器“Athlon Neo”和图形处理器“ATI Radeon X1250”集成在一个芯片中 AMD fasion,intel Clarkdale GPGPU/流处理器 异军突起的Clarkdale 2010年1月8日,英特尔发布32纳米westmere,集成32nm双核+45nm图形核心在一个处理器中 英特尔可切换显卡技术 集显性能逼近NVIDIA的低端独显 DX10 DX9以及之前的时代 衡量显卡性能最重要的两个指标就是顶点单元(Vertex shader)和像素单元(pixel shader)的运算能力 通常VS和PS单元更多的显卡性能也越强 DX10规范 微软将VS和PS(还有一个Geometry shader几何渲染器,GS)的功能合并,统一为Unified shader,也称为Stream proceser(流处理器) 统一渲染单元的好处是显而易见的,设计人员不需要再考虑
您可能关注的文档
- 专题:双曲线.doc
- 六年级美术测试题.doc
- 加强教学改革提高教学质量.doc
- 学校太阳能集热工程设计方案含报价.doc
- 时评写作材料.doc
- 第3章建设监理组织.ppt
- 资产支持票据.doc
- 高恩博-Canvas2D动画与游戏设计思路.ppt
- 因式分解复习课四.doc
- 高考学习方法总结图片版.doc
- 2024高考物理一轮复习规范演练7共点力的平衡含解析新人教版.doc
- 高中语文第5课苏轼词两首学案3新人教版必修4.doc
- 2024_2025学年高中英语课时分层作业9Unit3LifeinthefutureSectionⅢⅣ含解析新人教版必修5.doc
- 2024_2025学年新教材高中英语模块素养检测含解析译林版必修第一册.doc
- 2024_2025学年新教材高中英语单元综合检测5含解析外研版选择性必修第一册.doc
- 2024高考政治一轮复习第1单元生活与消费第三课多彩的消费练习含解析新人教版必修1.doc
- 2024_2025学年新教材高中英语WELCOMEUNITSectionⅡReadingandThi.doc
- 2024_2025学年高中历史专题九当今世界政治格局的多极化趋势测评含解析人民版必修1.docx
- 2024高考生物一轮复习第9单元生物与环境第29讲生态系统的结构和功能教案.docx
- 2024_2025学年新教材高中英语UNIT5LANGUAGESAROUNDTHEWORLDSect.doc
文档评论(0)