- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多核环境下矩阵设计与优化
摘 要
自1946年计算机问世以来,数值计算一直是计算机应用的主要领域之一,
它已经广泛应用到人类生产与生活的各个方面,矩阵运算是数值计算最基本和
经常使用的运算之一,它是数值计算的一个基础,提高矩阵运算的性能则显得
更为重要。本文把矩阵运算与多核、并行联系起来,并分别从矩阵库的设计,
矩阵库的并行化以及多核环境下矩阵库运算的优化三个方面阐述了矩阵库的实
现,具体内容如下:
(1)矩阵库的设计 先在完成功能、运算需求、可维护性、面向对象、并
行化等方面确定了矩阵库的设计原则;然后结合矩阵的数学定义、C++的特点和
以后程序扩充的需要的基础上,给出了矩阵库的组织结构,并在MicrosoftVisual
C++2008Edition平台上完成矩阵库的设计方案,最后在文中给出矩阵行
Express
列式求值的示例。
(2)矩阵库的并行研究 在分析现有的消息传递模型、数据并行模型、共
享存储并行编程模型三种并行模型之后,通过比较重点介绍了一种面向共享内
存的多处理器多线程并行程序语言—openMP,并对OpenMP指令、库函数和并
VisualC++2008
行化的循环选取原则作了介绍。然后在Microsoft Edition
Express
平台上用OpenMP并行机制对设计好的矩阵库串行程序实施并行化。同时,给
出了矩阵行列式求值的并行化处理示例。
VTune进行优化
(3)利用Intel 在介绍现有的一些优化工具之后,重点介
绍了英特尔公司针对英特尔多核处理器开发的IntelVTune优化工具,然后在上
述平台下用Intel
VTune优化工具对并行处理后的矩阵库进行程序分析,采集大
量分析数据,以得到各种因素对运算效率的影响,并对算法进一步分析和改进。
(4)根据本文给出的矩阵库的中的矩阵的构造、矩阵的加减乘除运算、矩阵
相等、矩阵转置、判断矩阵对称、判断矩阵对称正定、一般矩阵的秩、求逆矩
阵、求对称正定矩阵逆、求托伯利兹矩阵逆等运算,在现有的软硬件平台上完
成了串行、并行、优化后不同方面的对比实验。
通过对矩阵各种基本操作的应用和对输出结果的分析,计算结果准确,程
序基本达到矩阵基本运算的初衷;通过实例的运算比较,结果表明并行优化后
的程序的性能有改善。
关键宇:多核,矩阵运算,并行计算,共享内存,OpenMP
Abstract
Sincetheadventof in1946,numericalhas one
beenof
computer computation
fieldsof has in
themain been thehuman’S
wicI嘶used
computerapplication,which
andall oflife.Inthenumerical matrixisoneof
productionaspects computation,the
themostbasicand
oftenUSe a matrixisacommonin
sense,the
operation.In
numeric
文档评论(0)