- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机系统结构第八章
2003.3.1 计算机系统结构 第八章 SIMD计算机(P451) SIMD同向量计算机对比 8.1 SIMD的5个组成部分(P453) 8.2 SIMD的两种结构类型(P453~P454) 8.2 SIMD的两种结构类型(P453~P454) 8.3 SIMD的代表实例 ─── ILLIAC IV(P457) 每个PUi的组成 8.4 SIMD的典型算法(P483) 本章小结 * SIMD计算机指由一个控制部件和多个运算部件组成的处理机为核心的计算机系统。这样的处理机又被称为并行处理机或阵列处理机。 SIMD 的主要用途是数组(向量或矩阵)运算,其特点是大量数据同时进行同种操作,所以只需要设置一个控制器。 CU PU3 PU2 PU1 MM3 MM2 MM1 IS IS DS1 DS2 DS3 SIMD计算机(即向量并行计算机)与向量流水计算机都适合作向量/矩阵运算,但工作方式不同。它们的主要的区别如下 参见P453图8.2 ,可以概括为5个字 运 ──运算器阵列,PE0~PEN-1(Processing Element); 控 ──控制器,CU(Control Unit),它是单一的,除了解释向量指令并驱动运算器阵列操作外,它还能独立完成标量运算; 存 ──存储器,LM0~LMN-1(Local Memory,也有的书标为PEM0~PEMN-1 。在后面要介绍的另一种结构中标为SM0~SMm-1 ,意为Share Memory),它们也构成一个阵列,这样才能满足运算器阵列并行存取多个数据的要求; 管 ──管理计算机,SC(Supervisor Computer),职能是从事作业运行前后的辅助操作(例如输入输出等),通常由一台通用小型机担任; 网 ──互连网络,ICN(Interconnection Network),职能是提供运算器阵列或存储器阵列的成员之间并行交换数据的高速通路。 (1)分布存储结构 P453图8.2。此结构PE对本地存储体存取数据非常方便,但对其它存储体进行交叉存取则无法实现,必须通过在各存储体之间进行置换操作,将数据转换为本地存取才能访问; (2)共享存储结构 P454图8.3。各PE可按多种对准模式对共享存储体交叉存取数据,在一定程度上避免了置换操作。 ILLIAC IV的ICN(P458) 它是单级PM2I网络的一个子集:F={PM2±0,PM2±(n/2)},这里n=8。 可以证明,任意两个结点之间的距离不超过7步。 ILLIAC IV的4条并行传输指令(P479) 循环右传1(西),循环左传8(北),循环左传1(东),循环右传8(南)。 每个PEi的组成(P458~P459) A ── 累加器(64位) B ── 通用寄存器(64位) R ── 互连寄存器(64位) M ── 模式寄存器(8位),其中的“活动位”控制本PEi对CU命令的响应 8.4.1 矩阵加、减(P484) 8.4.2 迭代平均(P483) 在工程数学中,经常需要求解场方程,其常用方程是拉普拉斯方程(式8.8)。用数字计算机求解该方程需要先将其差分化(步长为h),差分结果为式8.10,这是一个典型的中值公式,每一轮迭代中要对所有结点进行一次上述计算。当进行到所有结点第K轮值与第K+1轮值足够接近时,就认为得到了方程的数字解答。在SISD计算机上做每一轮迭代要求64个元素都按上述公式计算,共64次;在SIMD计算机上各单元可按上述公式并行计算,速度是前者的64倍。并行计算过程如下: 每一轮迭代中各结点的基本操作(参看教材P479程序8.1): 1.累加器清零; 2.现有数据同时北传; 3.累加器加上南来数据; 4.现有数据同时东传; 5.累加器加上西来数据; 6.现有数据同时南传; 7.累加器加上北来数据; 8.现有数据同时西传; 9.累加器加上东来数据; 10.累加器除以4,得新数据; 11.若新数据与现有数据之差大于允差,则以新数据替换现有数据,转1,否则结束。 8.4.3 非数组问题的向量化算法(P486) (1) SIMD的5个组成部分 (2) SIMD的两种结构类型 (3) SIMD的代表实例 ─── ILLIAC IV (4) SIMD的典型算法。 习题:P498,题12。
文档评论(0)