- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
学科建设与教学改革 Computer Education
文章编号:1672-5913(2008)23-0103-04
“并行计算”课程算法实践教学的新工具:CUDA 编程模型
1 2
王智广 ,刘伟峰
(1.中国石油大学(北京)计算机科学与技术系,北京 102249;
2.中国石油化工股份有限公司石油勘探开发研究院信息技术研究所,北京 100083)
摘 要:本文首先从当今多核微处理器的发展趋势出发,介绍适用于多核微处理器的细粒度并行编程模型
CUDA ,以及其适用于“并行计算”课程教学的一系列优势,接着对当前可用的几种并行编程模型进行分析
和比较,最后给出采用 CUDA 编程模型的一个矩阵与矩阵相乘的教学实例。
关键词:并行计算;实践教学;CUDA
中图分类号:G642 文献标识码:B
1 计算”课程教学的一系列优势,并给出对几种主流并行编
程模型与 CUDA 的分析和比较,最后提供一个基于 CUDA
1998 年,教育部高等学校计算机科学与技术教学指导 的矩阵与矩阵相乘程序作为教学实例。
委员会将“并行计算”课程定位在高等学校计算机专业高
2
年级本科生或研究生以及面向计算学科的非计算机专业
的研究生层次上。“并行计算”课程一般主要包括以下四 过去的 20 年间,提高运行频率是 CPU 性能提高的主
个层面:(1)在算法理论层面主要讲授可计算性与计算复杂 要方式,然而,自 2003 年以来,这种趋势发生了变化,
性以及算法研究的数学基础;(2)在体系结构层面主要讲授 不断提高的 CPU 频率带来了高功耗和高发热量,使得主流
并行计算机体系结构;(3)在算法设计层面主要讲授计算机科 CPU 频率止步于 4 GHz ,并向单芯片多处理器(Chip Multi
学及其他科学计算领域中的非数值和数值并行算法;(4)在算 Processors, CMP) ,即多核方向发展。2005 年,Intel 和 AMD
法实践层面主要讲授基于并行编程模型的并行算法编程。 正式向主流消费级市场推出了双核心的 CPU 产品,2007
实际上,对于大多数学习“并行计算”课程的非并行 年推出了 4 核心的 CPU,按照各厂商的发展路线图,今后
计算研究方向的学生来讲,第(4)层面,即算法实践是课程 大约每 2 年单 CPU 上的核心数将翻番。但由于市场变化
最具价值的组成部分。将并行算法实现成程序并投入大规 和研制成本的原因,多核 CPU 的每个核都基于以往 CPU
模科学与工程计算生产应用是课程的最主要学习目的之 的单核设计,保留了如乱序执行等很多单核时代的复杂
一。其中对于编程模型的选择又是算法实践教学的重要前 执行方式,使得其对于科学计算等问题的计算能力提高非
提。以往“并行计算”课程在算法实践教学中大多采用 常有限。
MPI 作为编程模型,可 MPI 的粗粒度特性不仅不足以满足 此时,以游戏加速和图形处理为初衷设计的
“并行计算”课程的实践需要,还很难利用当前多核微处 GPU(graphics processing unit, 图形处理器) 以超出摩尔定
理器的硬件细粒度优势。 律的速度发展,并开始在非图形的高性能计算领域被大量
本文从当今多核微处理器的发展趋势出发,介绍适用 使用。图 1 为近年
文档评论(0)