沈阳平板电脑招商-EPAI中国大学生团队创业计划-显卡其实是一块高性能加速器.docVIP

沈阳平板电脑招商-EPAI中国大学生团队创业计划-显卡其实是一块高性能加速器.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
买到显卡其实是一块高性能加速器。特别是现在NVIDIA 和AMD显卡产品都体现消耗的物理限制。而GPU用途已经远远超出运行游戏。 双精度浮点运算中的衰减也越一款中端显卡一天24小时可以计算0个左右的大分子蛋白质折叠,出了极高的浮点运算能力。而一款酷睿2双核 相信大E7200处置器的一个核心在24小时内完成一个小分子包运算任务都非常困难。CPU和GPU高密度多线程浮点运算中体现出的性耗比差异。 将着重分析GPU相对于CPU架构优势。CPU和GPU架构差异很大,家已经非常清楚。这一节。CPU功能模块很多,能适应复杂运算环境; 目前流处置器和显存控制器占据了绝大部分晶体管。CPU中大部分晶体管主要用于构建控制电路(比如分支预测等)和GPU构成则相对简单。 而且对Cach需求小,Cach只有少部分的晶体管来完成实际的运算工作。CPU和GPU逻辑架构对比 而GPU控制相对简单。所以大部分晶体 使得GPU计算速度有了突破性的飞跃,管可以组成各类专用电路、多条流水线。拥有了惊人的处置浮点运算的能力。现在CPU技术进步正在 而GPU视频卡上的图形处置器)运行速度已超过摩尔定律,慢于摩尔定律。每6个月其性能加倍。CPU架构是有利于X86指令集的串行架构 任务是屏幕上合成显示数百万个像素的图像—也就是同时拥有几百CPU从设计思路上适合尽可能快的完成一个任务;对于GPU来说。 因此GPU被设计成可并行处理很多任务,万个任务需要并行处理。而不是像CPU那样完成单任务。CPU内部架构 当今CPU仅前端部分就非常复杂 还要有良好的应用环境兼容性,指令解码、分支预测等局部消耗晶体管数量巨大。CPU设计目标是不只要有很高的吞吐量。CPU所要面对的 应用面远远超过了GPUCPU设计用来处理通用任务的处置、加工、运算以及系统核心控制等等的CPU中包含的最基本部件有算术逻辑单元和 CPU微架构是为高效率处置数据相关性不大的计算类、复杂繁琐的非计算类的等工作而优化的目的处置日常繁复的任务中应付控制单元。 现在最主要的实现3D图形加速,自如。GPU设计的宗旨是实现图形加速。因此它设计基本上是为3D图形加速的相关运算来优化的如z- 纹理映射(texturmap图形的坐标位置变换与光照计算(transformlight等等。这类计算的对象都是针buffer消隐。 单精度浮点占到其处理数据的绝大多数,对大量平行数据的运算的数据量大。但是GPU面对的数据类型比较单一。直到GTX200和HD4800系列 显卡才对双精度运算提供了支持。产品:ATIRadeonHD4850显示芯片 GPU并行编程为何加速发展 GPU并行编程为何加速发展 回到 可能有很多读者会问到为什么要花这么大力气将传统CPU上运行的顺序移植到刚开始讨论的地球科学、医学研究与金融建模那些计算问题。 GPU环境中运行?答案其实很简单—追求更高的性价比和性耗比。GPU能够明显加速算术密集型并行计算任务 虽然GPU并不适用于所有问题 但是发现那些对运算力量耗费巨大的科学命题都具备天然的算术密集型”特色。这类程序在运行时拥有极高的运算密度、并发求解。 无论是音频处置、视觉仿真还是分子动力学模拟和金融风险评估领域都有大量涉及。这种问题如果能够顺线程数量和频繁地存储器访问。 将为我带来更高效的解决方案。浮点能力首次超越TFLOPSASCIRed超级计算机 996年,利迁移到GPU为主的运算环境中。美国Sandia国 家实验室研发了超级计算机“ASCIRed浮点运算性能首次突破TFlop但它需要非常多的节点和耗电。一套基于mesh网状结构(38X

文档评论(0)

yyh892289 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档