系统结构历年试题幻灯片.docVIP

  • 153
  • 0
  • 约1.79万字
  • 约 53页
  • 2017-06-25 发布于湖北
  • 举报
1999年 1 2000年 4 2001年 8 2002年 11 2003年 15 2004年 20 2005年 24 2006年 29 2007年 34 2008年 38 2009年 41 思考题 1 1999 一.(5分)解释下列名词 1.Amdahl定律 2. 并行处理 3. 局部性原理 4. 虚拟共享存储器 5. 非均匀存储器(简称NUMA)型共享存储多处理机 二.(10分)某台计算机只有Load/Store指令能对存储器进行读/写操作,其它指令只对寄存器进行操作。根据程序跟踪实验结果,已知每种指令所占的比例及CPI数如下: 指令类型 指令所占比例 CPI 算逻指令 43% 1 Load指令 21% 2 Store指令 12% 2 转移指令 24% 2 1.(4分)求上述情况下的平均CPI; 2.(6分)假设程序由M条指令组成,算逻运算中25%的指令的两个操作数中的一个已在寄存器中,另一个必须在算逻指令执行前用Load指令从存储器取到寄存器。因此有人建议增加另一种算逻指令,其特点是一个操作数取自寄存器,另一个操作数取自存储器,即寄存器-存储器类型。假设这种指令的CPI等于2,同时,转移指令CPI变为3,求新的指令系统的平均CPI。 四.(10分)有一个由高速缓冲存储器与主存储器组成的二级存储系统,已知其主存容量为32KB,采用组相联方式进行地址映象与变换,主存与缓存的一块为64字节,缓存共分8组,每组16块。 1.(4分)画出主存与缓存的地址格式(地址总长度及各字段名称与位数) 2.(6分)假定Cache之存储周期为20ns,命中率为0.95,希望采用Cache后的加速比大于10,那么要求主存储器的存取速度应大于多少? 三.(10分)一动态多功能流水线由6个功能段组成,如下图 其中:S1、S4、S5、S6组成乘法流水线,S1、S2、S3、S6组成加法流水线。各个功能段时间均为50ns,假设该流水线的输出结果可以直接返回流水线输入端,而且设置有足够的缓冲寄存器,若按照最快的方式用该流水线计算 。 1.(4分)请画出其处理过程的时空图; 2.(6分)计算其实际吞吐率、加速比和效率; 2000 —、(共5分,每题1分)解释下列名词 1.MFLOPS 2.基准测试程序 3.分布存储多处理机 4.互连网络 5.数据驱动方式 二、(共12分,每题4分)简答题 1.请问在指令集结构设计中,应该考虑哪些主要问题,针对这些问题有哪些主要的设计选择? 2.请问向量处理机的工作方式可以分为哪几大类?它们对向量处理支持主要有哪些技术特点? 3.Cache的写操作有哪两种方式?从可靠性和通信量(指Cache与主存间)两方面比较两种方式的优劣。 三、(6 分)设有100个处理器,要求应用程序的加速比达到80,求: 1.应用程序所需的并行化比率(应用程序中可并行化成分占应用程序的百分比); 2.在使用50个处理器的方式下,请求出该应用程序的加速比; 3.请分别求出使用100个和50个处理器时的加速效率。 五、(6分)在页式虚拟存储器中,一个程序由P1~P5共5个页面组成,在程序的执行过程中,依次访问到的页面顺序如下:P2,P3,P2,P1,P5,P2,P4,P5,P3,P2,P5,P2, 1.假设系统分配给这个程序的主存有3个页面,采用LFU替换算法,试求出其页命中率。 2.如果在程序执行过程中每访问一个页面,平均要对该页面内的存储单元访问32,求访问主存单元的命中率? 四、(6分)假设一台主频为200MHZ的向量处理机中功能部件的启动开销为:取数和存数为12个时钟周期、乘法部件为7个时钟周期、加法部件为6个时钟周期;向量寄存器的长度为64,允许向量链接处理;执行标量代码开销(分段开采开销)是一个常数,大小为15。现在该向量处理机上运行下列DAXPY代码(,其中X和Y是长度为n的向量,初始时已存放在内存;a是一个标量): LV V1,RX; 取向量X MULTSV V2,F0,V1; 标量和向量相乘 LV V3,RY; 取向量Y ADDV V4,V2,V3; 相加 SV RY,V4; 存结果 求DAXPY在该向量处理机上运行所需要的时钟周期数。最大性能是多少MFLOPS?半性能向量长度是多少? 2001 一、解释下列名词(共5分,每题1分) (1)MIPS (2)窗口重叠技术 (3)预约表 (4)互连网络直径 (5)机群系统 二、填空(共12分,每空1分) (1)在虚拟存储器中有三种地址空间,一种是应用程序员用来编写程序的地址空间

文档评论(0)

1亿VIP精品文档

相关文档