系统结构实验九基于Cache矩阵乘积算法性能改善实验.docVIP

系统结构实验九基于Cache矩阵乘积算法性能改善实验.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
系统结构实验九基于Cache矩阵乘积算法性能改善实验

PAGE PAGE 2 实验九:基于Cache的矩阵乘积算法性能改善实验 一、背景知识 Bill Joy(Sun Microsystems公司首席科学家兼首席执行官)曾开玩笑地说,高速缓存(Cache)是计算机科学中唯一重要的思想。虽然是一句玩笑话,但从中也可以看出高速缓存在计算机系统结构中确实占据了很重要的地位。 描述Cache概念的第一篇论文可以追溯到1965年Wilkes发表的论文“M.V. Wilkes, Slave Memories and Dynamic Storage Allocation, Trans. IEEE, Vol. EC-14, No. 2, Apr. 1965, pp. 270-271”,他在文中说“讨论这样一种存储器的使用方式,一个容量为32000个字的快速主存在一个容量为100万个字的速度较慢的主存的控制下工作,则以这种方式,在实际情况中,有效的存储器访问时间接近于快速存储器而不是较慢的存储器”。Wilkes1913年出生于英国,曾参与EDSAC的设计,1980年因对Cambridge Ring Network的突出贡献而获得Eckert-Mauchly奖。随后,IBM(何处无君影)在1968年生产出第一台带有Cache的商业化计算机IBM 360/85,测试表明,在11个测试程序中,只有3个程序是360/91(时钟周期60ns)胜过了360/85(时钟周期80ns)。之后就展开了关于Cache的大讨论。编译器和操作系统系统结构支持研讨会(Symposium on Architecture Support for Compilers and Operating Systems,ASPLOS)和国际计算机系统结构研讨会(International Computer Architecture Symposium,ISCA)从20世纪90年代以来,发表的关于Cache的论文不计其数,以致有些人戏称ISCA为国际Cache结构研讨会。 时至今日,Cache应用无处不在。下图是张晓东教授在龙星课程讲稿中给出的单机系统中Cache分布情况,在网络中,Cache也是比比皆是,如代理服务器,DNS服务器等等。另一方面,张教授也认为,目前计算机系统的情况是,CPU时钟非常丰富,存储空间也足够的大,瓶颈问题是数据取不出来,而Cache思想则是解决办法之一。 那么,Cache对我们有什么实际意义呢?无论我们将来是从事高性能计算,还是感兴趣于网络开发,亦或喜欢数据库研发,都离不开要考虑系统的具体结构,都绕不过Cache思想对系统性能的影响。 本实验通过一个简单的例子,验证Cache对系统性能的影响。请按要求完成实验,获得实验数据,并对实验结果给出合理的解释。 本实验做完,我们的系统结构实验课程就算结束了。回顾这9个实验,几乎无一例外的是验证型的实验,这确实是个缺憾!但是,如果给出设计型或综合性的实验题目,又有多少人能完成呢?通过大家这一学期对本实验课的态度,从预习到实验到实验报告,我感觉不到大家对本实验的热情,也没有看到大家的能力。但愿是我眼晕,希望大家用最后一个实验报告给我一个证明,使我对下一级的同学充满希望。 二、实验目的: 1、了解Cache对系统性能的影响 2、了解基于系统结构的算法设计思想 三、实验内容: 1、用C语言实现矩阵(方阵)乘积一般算法(程序1),填写下表: 矩阵大小 100 500 1000 1500 2000 2500 3000 一般算法执行时间 2、程序2是基于Cache的矩阵(方阵)乘积优化算法,填写下表: 矩阵大小 100 500 1000 1500 2000 2500 3000 优化算法执行时间 3、计算优化后的加速比(speedup) 三、实验报告 1、认真记录实验数据 2、分析实验数据 附: 程序1: #include sys/time.h #include unistd.h #include stdio.h main(int argc,char *argv[]) { float *a,*b,*c,temp; long int i,j,k,size,m; struct timeval time1,time2; if(argc2) { printf(\n\tUsage:%s Row of square matrix\n,argv[0]); exit(-1); } size=atoi(argv[1]); m=size*size; a=(float*)malloc(sizeof(float)*m); b=(float*)malloc(sizeof(float)*m); c=(float*)malloc(sizeof(float)*m); for(i=0

文档评论(0)

aicencen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档