GPU上的矩阵乘法的设计和实现.pdfVIP

  • 58
  • 0
  • 约1.76万字
  • 约 5页
  • 2017-06-09 发布于湖北
  • 举报
计 算 机 系 统 应 用 2011 年 第 20 卷 第 1 期 GPU 上的矩阵乘法的设计与实现① 梁娟娟,任开新,郭利财,刘燕君 ( 中国科学技术大学 计算机科学与技术学院,合肥 230027) 摘 要: 矩阵乘法是科学计算中最基本的操作,高效实现矩阵乘法可以加速许多应用。本文使用NVIDIA 的CUDA 在 GPU 上实现了一个高效的矩阵乘法。测试结果表明,在 Geforce GTX 260 上,本文提出的矩阵乘法的速度是 理论峰值的 97%,跟 CUBLAS 库中的矩阵乘法相当。 关键词: 矩阵乘法;GPU ;CUDA Design and Implementation of Matrix Multiplication on GPU LIANG Juan-Juan, REN Kai-Xin, GUO Li-Cai, LIU Yan-Jun (School of Computer Science and Technology, University of Science and Technology of China, Hefei 230027, China) Abstract: Matrix multiplication is a basic operation

文档评论(0)

1亿VIP精品文档

相关文档