并行算法笔记.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
并行算法笔记

注:部分笔记参照周湖广同志发上来的,有些看不清楚,请额外自己核对。 第一章 ★ 并行计算机互连网络 1、一维线性阵列(参照教材11页) 2、网孔连接(Mesh-Connected) 将n个处理器连接成×的二维网孔结构互连函数 ①正向行连接: 逆向行连接: ②正向列连接: 逆向列连接: 其中x mod y=x-y[],只有y为负时,x mod y才为负。[x]表示取≤x的最大整数。如:[3.12]=3,[-3.12]=-4 例:16个处理器的mesh结构(p=0~15) 正向行: 0 1 2 … 14 15 逆向行: 正向列: 逆向列: 最后的互连结构: Mesh结构的通信直径(任意两个处理器之间至多需要的路由数): Mesh特点:规整、扩展性比较好。不足:处理器之间互连是固定的,缺乏灵活性。 改进Mesh结构——可重构造的Mesh结构(Rmesh),动态构造处理器之间的互连方式。(教材311页) 3、树结构 将n个处理器连接成一个深度为的二叉树结构,互连函数: 参考教材13页 图1.10 四级二叉树 通信直径:,特点:树根易成为瓶颈,树结构适用于“淘汰”机制型应用问题的并行处理,主从型的应用。 变种—×树:同层的兄弟节点处理互连,降低通信直径,减少树根的处理器的负担。 4、树网结构 5、金字塔结构 6、超立方结构(Hypercube Connected) 将n个处理器连接成一个超立方结构,处理器编号用二进制表示,,互连函数: 例:n=16个处理器的超立方结构 超立方通信直径:,直接互连的两个处理器的编号二进制只有一位不同,路由寻优方式实现容易,扩展性相对较差。 改进型:光电传输结合,每个立方体内部的处理器采用电信号连接,不同立方体之间的处理器采用光信号连接。 7、立方环结构 8、洗牌交换网络SE 将n个处理器通过洗牌和交换实现数据在处理器之间的传输,互连函数: 例:n=8个处理器SE网络 图形参考教材17页图1.15 SE的性质: 对于网络处理器中的数据,连续执行m次洗牌操作,则数据返回原来位置。 若数据存储在一对二进制编号反在第0位不同处理器中,则经过k (1≤k≤m)次洗牌之后,这些数据将位于二进制编号仅在第m-k为不同的处理器中。 在这个网络上我们通过灵活洗牌和交换操作,即可设计高效算法。 9、蝶形网络 对于k×n的蝶形网络,为第r行第i列上的处理器,第k行等同于第0行,互连函数: 例:n=8,k=3的蝶形网络 处理器之间连接按2的幂次展开,通信直径。 10、其他互连结构—总线、交叉开关、多级网络 主要用于SMP(全对称多处理器)机器的互连≤64个处理器→SMP Cluster→用mesh互连多个SMP ★并行随即存储机器模型PRAM Parallel 也称为共享存储器的SIMD模型,SM—SIMP SM—Shared Memory 由硬件实现各个处理器并执行进程之间的同步,各个处理器通过读/写SM中存储单元实现数据通信。算法复杂度主要计算时间构成。 不允许同时读和同时写PRAM—EREW:不允许多个处理器同时读/写SM中同一个单元的内容 允许同时读但不允许同时写PRAM—CREW:允许多个处理器同时读入SM中同一单元的数据,但不允许并发写 允许多个处理器同时读/写SM中同一单元PRAM—CRCW: 只允许所有的处理器同时写相同的数CPRAM—CRCW 只允许最优先的处理器先写PPRAM—CRCW 允许任意处理器自由写PRAM—CRCW 在EREW模型下解决并发读冲突:通过自顶向下生成一棵逻辑二叉树的方法,用次并发读/写操作即可使n个处理器获得同一个数据。 解决写冲突:采取淘汰机制,由低向上生成一棵竞赛树的方法,决定出能成功写入数据的处理器,用次并行比较淘汰。 ★分布存储模型(教材28页) 1、固定连接的SIMD模型 算法运行时间=计算时间+数据(选路、路由)时间 2、MIMD—AC(MIMD并行通信模型) 软件同步:算法运行时间=计算时间+通信(选路、路由)时间 在证明模型上并行算法时,应尽量减少通信次数,每次通信的数据量…… 每个处理器都有其局存,各个处理器(进程)通过传递消息完成数据交换(通信) 3、BSP模型的基本参数 大同步并行(Bullk Synchronous Parallel)是MIMD—AC的变种 特点:①为了减少通信时间,每次传递的是“大量数据块” ②将若干个操作设计成一个超级步进级同步。 4、异步LogP模型 是MIMD—AC的变种,强调了点对点通信,当G=0,L=0,O=0时,LogP模型→PRAM模型 5、C3模型:是MIMD—AC的变种,C-计算,C-通信,C-拥塞→强调代价 ★并行计算系统的层次存储模型(将网络数据的发送/接收操作视为

文档评论(0)

2017meng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档