perflab实验报告(同名8817).docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
湖南大学课程实验报告 课 程 名 称: 计算机组成与结构 实验项目名称: perflab 专 业 班 级: 姓 名: 学 号: 指 导 教 师: 完 成 时 间: 2015 年 05 月 22 日 计算机科学与工程系 实验题目:程序性能调优实验 实验目的: kernel.c文件中主要有两个需要进行优化的函数:rotate和smooth,并分别给出了naive_rotate和naive_smooth两个函数的基本实现作为baseline作为你改进后的程序的比较对象。你需要读懂rotate和smooth函数,并对其进行优化。你每写一个新版本的、优化的rotate和smooth函数,均可在成注册后使用driver进行测试,并得到对应的CPE和加速比。本次实验,要求针对每个函数、每个人均至少写出3种优化版本、并根据driver报告的结果进行性能分析。 实验环境: Vmware虚拟机 ubuntu12.04 linux终端 实验步骤和结果分析: 函数源码: rotate函数: void naive_rotate(int dim, pixel *src, pixel *dst) { int i, j; for (i = 0; i dim; i++) for (j = 0; j dim; j++) dst[RIDX(dim-1-j, i, dim)] = src[RIDX(i, j, dim)]; } rotate函数的作用是通过将每个像素进行行列调位,将一副点阵图像进行90度旋转。其中RIDX(i,j,n)即((i)*(n)+(j))。函数缺点为程序局部性不好,循环次数过多。可以对其进行分块来提高空间局部性,也可以进行循环展开。 smooth函数: void naive_smooth(int dim, pixel *src, pixel *dst) { int i, j; for (i = 0; i dim; i++) for (j = 0; j dim; j++) dst[RIDX(i, j, dim)] = avg(dim, i, j, src); } smooth函数的作用是通过对图像每几点像素求平均值来对图像进行模糊化处理。函数缺点是循环次数过多和频繁调用avg函数,avg函数中又包含许多函数。应该减少avg函数的调用次数,且进行循环展开。 第一种版本: CPE分析: rotate函数: void rotate(int dim, pixel *src, pixel *dst) { int i,j,ii,jj; for(ii=0;iidim;ii+=4) for(jj=0;jjdim;jj+=4) for(i=ii;iii+4;i++) for(j=jj;jjj+4;j++) dst[RIDX(dim-1-j,i,dim)]=src[RIDX(i,j,dim)]; } 多添加了两个for函数,将循环分成了4*4的小块,在cache存储体不足够大的情况下,对循环分块能够提升高速缓存命中率,从高提升了空间局部性。从测试的CPE中也可以看出,在dim是64的时候,原代码和本代码CPE相差不大,而随着dim的增大,本代码CPE增加不大,而原代码CPE急剧增加,就是受到了cache存储的局限性。 smooth函数: void smooth(int dim, pixel *src, pixel *dst) { pixel_sum rowsum[530][530]; int i, j, snum; for(i=0; idim; i++) { rowsum[i][0].red = (src[RIDX(i, 0, dim)].red+src[RIDX(i, 1, dim)].red); rowsum[i][0].blue = (src[RIDX(i, 0, dim)].blue+src[RIDX(i, 1, dim)].blue); rowsum[i][0].green = (src[RIDX(i

文档评论(0)

xina171127 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档