GPU分散式演算法设计与单机系统模拟(第二季).pptVIP

GPU分散式演算法设计与单机系统模拟(第二季).ppt

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ICAL ICAL GPU分散式演算法設計與單機系統模擬(第二季) 高雄大學 吳志宏 2/1/2010 ICAL * Outline OpenMP CUDA vs. OpenMP GPU Experiment Nvidia Tesla OpenMP with Tesla Conclusion 2/1/2010 OpenMP Open Multi-Processing,OpenMP(only for Intel) OpenMP is an API to supports multi-platform shared memory multiprocessing programming in C/C++ and Fortran on all architectures. 11/17/09 * ICAL OpenMP vs. CUDA OpenMP使用多核心CPU來運算 優點: 可以平行化的程式比較多(允許較複雜程式) ,可依照task目標來平行。 在CPU之中執行程式, 在memory的溝通上較快, 且無額外成本。 缺點: 在大量簡單資料處理上較慢, 因為核心數少。 只有Intel的產品支援。 2/1/2010 * ICAL OpenMP vs. CUDA(續) CUDA使用大量核心的GPU運算 優點:在處理資料量龐大而簡單的運算時,加 速非常明顯,可為CPU的數十倍甚至數 百倍。 缺點: 只能處理較簡單的運算。 資料精度受到限制,用double效能會大大降低。 在memory的溝通上較慢,有較多額外的I/O成本。 只有Nvidia Geforce 8系列以上的GPU支援。 2/1/2010 * ICAL 2/1/2010 ICAL * GPU Experiment 預先使用SVD演算法將一張1024×1024的影像分解成9個1024×1024的距陣。 設計演算法將前述的9個距陣透過乘法還原原始影像,分別使用單一核心CPU、4核心CPU、96核心GPU進行模擬。 11/17/09 GPU Device NVIDA Geforce 9600 GSO Cores 96 Processor Clock 1375 MHz Standard Memory 384 MB Memory Bandwidth 38.4 GB/sec CPU Device Intel Core2 Quad Q9300 Cores 4 Processor Clock 2.5 GHz FSB speed 1333 MHz L2 Cache 6 MB Experiment Environment 2/1/2010 * ICAL Experiment Results 2/1/2010 Single-Core Multi-Core CUDA Speedup VS. Single-Core Speedup VS. Multi-Core Red 43.36 sec. 22.437 sec. 0.766 sec. 56.606 29.291 Green 44.046 sec. 25.312 sec. 0.562 sec. 78.374 45.039 Blue 44.219 sec. 26.64 sec. 0.562 sec. 78.681 47.402 Total (sec.) 131.625 sec. 74.389 sec. 1.89 sec. 71.220 40.577 * ICAL Experiment Results Nvidia Tesla The Tesla GPU is a General Purpose GPU. The primary function of Tesla products are to aid in simulations, large scale calculations ,and image generation for professional and scientific fields,with the use of CUDA. 2/1/2010 * ICAL OpenMP with Tesla 一台單機系統可使用PCI-E x16插槽接PCI-E橋接卡,透過橋接卡外接一台Tesla專用機櫃,一個機櫃最多可插4張Tesla加速卡。 2/1/2010 * ICAL OpenMP with Tesla(續) 可使用多核心CPU搭配數張Tesla加速卡做協同運算,但資料無法在不同的Tesla加速卡之間做交換,因此必須在程式中預先指定哪些資料要分給哪一張卡做處理。 當程式執行時用用多核心程式來安排每一個CPU核心執行不同的任務(task),再由各自核心去控制指定的GPU來進行資料(data)加速。 例:4 cor

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档