- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                中科大多核并行计算课件
                    现代密码学理论与实践之五 第三篇 并行数值算法   第八章 基本通讯操作   第九章 稠密矩阵运算   第十章 线性方程组的求解   第十一章 快速傅里叶变换  第九章 稠密矩阵运算     9.1 矩阵的划分    9.2 矩阵转置    9.3 矩阵-向量乘法       9.3.1 带状划分的矩阵-向量乘法       9.3.2 棋盘划分的矩阵-向量乘法       9.3.3 矩阵-向量的脉动乘法   9.4 矩阵乘法 矩阵-向量乘法 求Y=AX                   串行算法计算时间t(n)=O(n2) 第九章 稠密矩阵运算     9.1 矩阵的划分    9.2 矩阵转置    9.3 矩阵-向量乘法       9.3.1 带状划分的矩阵-向量乘法       9.3.2 棋盘划分的矩阵-向量乘法       9.3.3 矩阵-向量的脉动乘法    9.4 矩阵乘法  带状划分的矩阵-向量乘法(1) 划分(行带状划分): Pi存放xi和ai,0,ai,1,…,ai,n-1, 并输出yi 算法: 对p=n情形     ①每个Pi将其向量元素向其他处理器播送xi(多到多播送);     ②每个Pi做相应计算; 注: 对pn情形,算法中Pi要播送X中相应的n/p个分量     (1)超立方连接的计算时间               (2)网孔连接的计算时间  带状划分的矩阵-向量乘法(2) 示例 第九章 稠密矩阵运算     9.1 矩阵的划分    9.2 矩阵转置    9.3 矩阵-向量乘法       9.3.1 带状划分的矩阵-向量乘法       9.3.2 棋盘划分的矩阵-向量乘法       9.3.3 矩阵-向量的脉动乘法    9.4 矩阵乘法  棋盘划分的矩阵-向量乘法(1) 划分(块棋盘划分): Pij存放ai,j, xi置入Pi,i中 算法: 对p=n2情形     ①每个Pi,i将其向量元素向Pj,i播送xi(一到多播送);     ②按行方向进行乘-加与积累运算,最后一列Pi,n-1收集的结果为yi; 注: 对pn2情形,p个处理器排成          的二维网孔,          算法中Pi,i向Pj,i播送X中相应的        个分量     (1)网孔连接的计算时间Tp(CT):         .X中相应分量置入Pi,i的通讯时间:        .按列一到多播送时间:         .按行单点积累的时间:  棋盘划分的矩阵-向量乘法(2) 示例 带状与棋盘划分比较 以网孔链接为例 网孔上带状划分的运行时间  网孔上棋盘划分的运行时间  棋盘划分要比带状划分快。  第九章 稠密矩阵运算     9.1 矩阵的划分    9.2 矩阵转置    9.3 矩阵-向量乘法       9.3.1 带状划分的矩阵-向量乘法       9.3.2 棋盘划分的矩阵-向量乘法       9.3.3 矩阵-向量的脉动乘法    9.4 矩阵乘法 矩阵-向量乘法的脉动算法(1) 示例 矩阵-向量乘法的脉动算法(2) 示例 第九章 稠密矩阵运算     9.1 矩阵的划分    9.2 矩阵转置    9.3 矩阵-向量乘法    9.4 矩阵乘法        9.4.1 简单并行分块乘法        9.4.2 Cannon乘法        9.4.3 Fox乘法        9.4.4 Systolic乘法          9.4.5 DNS乘法 矩阵乘法符号及定义 矩阵乘法并行实现方法 计算结构:二维阵列 空间对准(元素已加载到阵列中)      Cannon’s ,   Fox’s,DNS 时间对准(元素未加载到阵列中)      Systolic   简单并行分块乘法(1) 分块: A、B和C分成              的方块阵Ai,j、Bi,j和Ci,j, 大小均为                p个处理器编号为                                   , Pi,j存放Ai,j、Bi,j和Ci,j。 算法:      ①通讯:每行处理器进行A矩阵块的多到多播送(得到Ai,k, k=0~        )           每列处理器进行B矩阵块的多到多播送(得到Bk,j, k=0~        )      ②乘-加运算: Pi,j做 运行时间    (1)超立方连接:        ①的时间        ②的时间 简单并行分块乘法(2) 运行时间    (1)超立方连接:    (2)二维环绕网孔连接:     ①的时间
                 原创力文档
原创力文档 
                        

文档评论(0)