- 1、本文档共54页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* ⑴用标量处理机来处理 其本质是一个循环,计算过程如下: 用标量指令对向量中的每个元素进行一次乘、加、存储操作 为了实现循环操作,每次都必须指明对X和Y中元素位置的下标变量加1,并使操作次数每次减1,以判断循环是否结束 现假定X和Y向量的首元素读出后放到寄存器RX和RY中, 当向量元素长度为64时,循环程序段如下: LD F0, a ; 标量a装入寄存器F0 ADD R4, Rx, #512 ; 向量元素的末地址装入寄存器R4 LOOP: LD F2, M(Rx) ; 取向量元素X(i) MUL F2, F0, F2 ; a与X(i)相乘 LD F4, M(Ry) ; 取向量元素Y(i) ADD F4, F2, F4 ; aX(i)与Y(i)相加 SD M(Ry), F4 ; 存储结果向量元素 ADD Rx, Rx, #8 ; X向量元素下标加1 ADD Ry, Ry, #8 ; Y向量元素下标加1 SUB R20, R4, Rx ; (R4)-(Rx)→R20,计算是否到界限值 BNZ R20, LOOP ; 若循环未结束,转LOOP * ⑵ 用向量处理机处理 使用向量指令 一条向量指令可以一次完成X或Y向量中所有元素的处理 因此完成同样操作的程序段如下: LD F0, a ; 标量a装入F0 LV V1, M(X) ; 向量X装入V1向量寄存器(LV为向量取指令) MULV V2, F0, V1 ; 向量X与标量a相乘(MULV为向量乘指令) LV V3, M(Y) ; 向量Y装入V3向量寄存器 ADDV V4, V2, V3 ; 向量加aX+Y(ADDV为向量加指令) SV M(Y), V4 ; 存储结果向量(SV为向量存指令) * 对上述两段标量处理机、向量处理机程序简单比较可知: 向量处理机只需执行6条指令,而标量处理机共需执行9×64+2=578条指令 这是因为向量指令是对向量中的64个元素一次性进行操作,而且没有标量循环中对元素下标变量加1和判断循环是否结束的最后4条指令 * 一条向量指令可以处理N个或N对操作数 把这N个互相独立的数称为向量 对这样一组数的运算称为向量处理 因此,向量指令的处理效率要比标量指令的处理效率高得多 * 【例9-2】 用高级语言和向量加法指令分别计算以下表达式: ci=ai+5+bi i=10, 11, 12, …, 1000 【解】 ⑴ 用高级语言实现的代码如下(以C语言为例): for (i=10; i=1000; i++) c[i] = a[i+5] + b[i]; ⑵ 在具有向量数据表示的机器中,可用一条向量加法指令实现: C(10:1000) = A(10+5:1000+5) + B(10:1000) 显然,对参加运算的每个向量都需指明其基地址、位移量和向量长度 因此,向量加法指令的格式可采用如下形式: 向量加 A向量参数 B向量参数 C向量参数 * 9.3 阵列处理机 9.3.1 阵列处理机的操作模型和特点 * 9.3.1 阵列处理机的操作模型和特点 1. 阵列处理机的操作模型 2. 阵列处理机的特点 * 1. 阵列处理机的操作模型 阵列处理机又称并行处理机 主要技术手段是采用硬件资源重复的方法来实现并行性 属于SIMD结构计算机 单指令流多数据流SIMD计算机用一个控制部件同时管理多个处理单元 所有处理单元均收到从控制部件广播来的同一条指令,但是操作的对象却是不同的数据 * 2. 阵列处理机的特点 向量流水处理机和阵列处理机都能对大量数据进行向量处理,但它们之间存在很大的区别,阵列处理机有着向量处理机所不具备的特点: ⑴阵列机是以单指令流多数据流方式工作的 ⑵阵列机采用资源重复方法引入空间因素 在系统中设置多个相同的处理单元来实现并行性 利用并行性中的同时性,所有处理单元必须同时进行相同的操作 * ⑶阵列机是以某一类算法(如图像处理)为背景的专用计算机 由于阵列机中通常都采用简单、规整的互连网络来实现处理单元间的连接操作,从而限定了其所适用的求解算法类别 ⑷阵列机的研究必须与并行算法的研究密切结合 以使其求解算法的适应性更强一些,应用面更广一些 ⑸从处理单元来看,由于结构都相同,因而可将阵列机看成是一个同构型并行机 但其控制器实质上是一个标量处理机 而为了完成I/O操作及操作系统管理,尚需一个前端机 因此,实际的阵列机系统是由上述三部分构成的一个异构型多处理机系统 * 9.4 多处理机系统 9.4.1 多处理机系统的特点和分类 * 随着集成电路技术的不断发展,基于微处理器的多处理机并行系统由于其突出的性价比而逐渐成为高性能计算机的主流 * 9.4.1 多处理机系统的特点和分类 1. 多处理机系统
您可能关注的文档
- 改.第2章催化剂的表面吸附和孔内扩散教案详解.ppt
- 快消品流通渠道开拓方案教案详解.ppt
- 改2.2.1双曲线及其标准方程教案详解.ppt
- 改革开放的推进2015教案详解.ppt
- 宽带网及接入技术340页教案详解.ppt
- 改革开放是社会主义制度的自我完善和发展教案详解.ppt
- 宽带网维护培训2教案详解.ppt
- 宽带卫星通信第3章多址技术教案详解.ppt
- 改革开放以来家乡的变化邵阳篇教案详解.ppt
- 宽带卫星通信第4章星载和地球站设备教案详解.ppt
- 《艺术博物馆公共教育品牌化建设中的艺术教育与艺术教育创新体系研究》教学研究课题报告.docx
- 2025年园艺花卉电商跨境冷链运输冷链物流冷链配送时效性提升策略报告.docx
- 全球钠离子电池储能项目案例分析白皮书.docx
- 《农村土地流转过程中的土地流转风险与农村土地流转绩效评价研究》教学研究课题报告.docx
- 《共享办公空间与城市公共安全研究》教学研究课题报告.docx
- 医药商业并购项目2025年可行性分析与风险防范及预案实施与评估报告.docx
- 小学数学AR游戏化教学对儿童数学学习兴趣的激发研究教学研究课题报告.docx
- 校园足球活动对小学生团队合作能力培养的影响教学研究课题报告.docx
- 2025年房地产金融创新产品市场布局与融资渠道拓展研究报告.docx
- 《新能源汽车电池热管理系统热交换器流体动力特性分析与优化》教学研究课题报告.docx
最近下载
- 2025年台湾AI行销趋势报告(繁体版)-Kolr.docx VIP
- 湖北办公楼监控及电子围栏系统施工组织设计.doc VIP
- 围栏(施工组织设计围栏(施工组织设计).doc VIP
- 2024年台湾YouTube年度社群内容趋势报告(繁体版)-Kolr.pptx VIP
- 诺尔起重设备(中国)有限公司RTG&RMG中国福建招商局漳州开发区363105.pdf VIP
- 小区沥青道路设计做法.doc VIP
- 2025年台湾AI行销趋势报告(繁体版)-Kolr.pdf VIP
- 防雷安全知识试题及答案.doc VIP
- 智能体协议:MCP、A2A、ANP-智能体互联网的黎明之前.docx
- 国有企业收购合同协议.docx VIP
文档评论(0)