- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机系统结构课件1
第六章 向量处理机 6.1 向量处理机的基本概念 6.2 向量处理机的结构 6.3 向量处理的存取模式和数据结构 6.4 提高向量处理机性能的方法 6.5 向量处理机实例 6.6 向量处理机的性能评价 6.7 关于向量处理机的几点看法 向量处理机概况 1、向量处理机——用来解决数值计算,效率高,适用性广。 2、向量处理机采用流水线结构。 6.1 向量处理机的基本概念 6.1.1什么是向量处理 一条标量指令只能处理一个或一对操作数。 N个相互独立的数叫做“向量”,把这样一组数的运算叫做“向量处理”。一条向量指令可以处理N个或N对操作数。 6.1.2向量处理方式 1、横向处理方式 不适用于向量。 2、纵向处理方式 适用于向量 3、纵横处理:将上述纵向处理分组,以长度为n的向量寄存器保存中间结果,可减少内存访问时间。 6.2 向量处理机结构 要求:向量计算机的存储器系统能提供给运算其连续不断的数据流以及接收来自运算器的连续不断的运算结果,而带宽至少要3倍于一般存储系统。 6.2.1 存储器-存储器结构 见课本P351 图6.2-6.7 可变延迟 P354 图6.8-6.9 6.2.2 寄存器-寄存器结构 结构: 1)向量运算在一级寄存器中 2)标量运算在二级寄存器中 3)前面二者均有程序员或编译程序来管理 两种结构: (1)靠存储器分块,保证带宽, (2)靠中间存储器,流水结构运算器可以重叠操作。 6.3 向量存取模式和数据结构 6.3.1数值算法的存取模式 Ax=b ,A为N*N,x和b均为N*1,列向量。 (1)若A是稠密矩阵——行和列的一系列操作——用高斯消去法交换 (2)若A是稀疏矩阵——循环不归约——对角线 几点需求: 1)算法既要访问行,又要访问列。 2)向量操作或在两个向量间进行,或在一个向量与一个标量间进行,结果产生一个新的向量。 3)对一个向量 求MAX操作所得的结果是最大元素的下标,而不是最大元素本身。 4)每次循环使被访问向量长度减1。 6.3.2向量处理机的数据结构 向量处理机的系统结构采用存贮器-存贮器结构和寄存器-寄存器结构。向量操作数必须由四个量来确定。 1)起始地址 2)元素个数 3)精度 4)步距 通常,如果步距与存储模块数M互质,则M按该步长的连续访问是访问M个不同的存储模块。更一般的情况下,若存储块数M和步距S为任意值,则M次按步距S的连续访问是访问M/GCD(S,M)个不同的存储模块。GCD是求两个数的最大公因子函数,当两个变量互质时,最大公因子等于1。 第六章 向量处理机 6.1 向量数据表示方式 6.2 向量处理机的结构 6.3 向量处理方式 6.4 向量处理机的关键技术 6.5 向量处理机实例 6.6 向量处理机的性能评价 6.7 向量处理机的发展 6.4提高向量处理机性能的方法 1、较好地维持向量与标量性能的平衡 向量平衡点定义为为了使向量硬件设备和标量硬件设备的利用率相等,一个程序中向量代码所占的百分比。 较高的平衡点——各处理机重复设置流水线功能部件,向量部件采超流水线技术,时钟频率是向量流水线操作的两到三倍。 6.4.2 提高向量处理机性能的常用技术 向量的四类指令P369图6.18 1、链接技术-结果寄存器可能成为后继指令的操作数寄存器。链接是当从一个流水线部件将得到的结果直接送到另一个功能流水线的操作寄存器是而发生的连接过程。 2、向量循环或分段开采技术——一次处理一个向量段。 (2)只需存储非零元素,把非零元素在矩阵中的位置记录在一个数组中。 3、向量递归技术 一个向量寄存器用来同时存放源操作数和结果操作数。 4、稀疏矩阵的处理技术 稀疏矩阵两种表示方法 (1)一个稀疏向量由两个向量组成。其一是短向量,仅包含向量的非零元素。另一个是位向量,1表示对应位非零,0则对应零元素。 6.6向量处理机的性能评价 1、向量指令的处理时间Tvp 其中,Ts为向量流水线的建立时间,它包括向量起始地址的设置、计数器加1、条件转移指令执行等。Tvf为向量流水线的流过时间,它是一条指令从开始译码到流过流水线得到第一个结果元素的时间。Tc为流水线“瓶颈”段的执行时间。 2、最大性能R∞ 表示当向量长度为无穷大时的向量流水线的最大性能。常在评价峰值性能时使用,单位为MFLOPS。 因为分子的值与n无关,所以 3、半性能向量长度n1/2 它为达到一半R∞值所需的向量长度。它是评价向量流水线建立时间对性能影响的参数。它表示为建立流水线而导致的性能损失。 4、nv 表示向量流水方式的工作速度优于标量
您可能关注的文档
- 河南开封市2010-2011学年第一学期七年级思想品德试卷(含答案).doc
- 钢结构细则(美德C厂房).doc
- 全球旅游也标志集合.doc
- C++实验六静态成员.doc
- 2013年殷祖镇雨雪灾害卫生应急预案.doc
- 苏教版六年级上综合卷.doc
- 打造有效的执行模式.ppt
- 汉语拼音表及拼读练习题.ppt
- 专业技术职务任职资格推荐评审表8K.doc
- 内核改造概要设计.doc
- 300516_2024_#ESG_久之洋_2024年环境、社会及公司治理(ESG)报告_2025-03-28.pdf
- 301508_2024_#ESG_中机认检_中机寰宇认证检验股份有限公司2024年度环境、社会和公司治理(ESG)报告_2025-04-21.pdf
- 300693_2024_#ESG_盛弘股份_2024年环境、社会、公司治理(ESG)报告_2025-04-03.pdf
- 300339_2024_#ESG_润和软件_2024年度环境、社会和公司治理(ESG)报告_2025-04-22.pdf
- 300376_2024_#ESG#SD_ST易事特_2024年度可持续发展暨ESG报告_2025-04-29.pdf
- 300834_2024_#ESG_星辉环材_2024年度环境、社会及治理(ESG)报告_2025-04-29.pdf
- 301115_2024_#ESG_联检科技_2024年度环境、社会和治理(ESG)报告_2025-04-29.pdf
- 300308_2024_#ESG_中际旭创_2024年环境、社会及公司治理(ESG)报告_2025-04-21.pdf
- 想生科技产品注册公告及所需文件상생기술제품_등록_공고문_및_제출_서류.pdf
- 300760_2024_#SD_迈瑞医疗_2024年度可持续发展报告_2025-04-29.pdf
文档评论(0)