C++代码优化的27个建议.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
C代码优化的27个建议

C\C++代码优化的27个建议2014/05/22 | 分类:?/category/c-cpp/C/C++,?/category/programmer/开发?|?/67880/3 条评论分享到:149本文由?/伯乐在线?-?/author/zzzworm/周昌鸿?翻译自?/~dhouse/courses/405/papers/。欢迎加入技术翻译小组。转载请参见文章末尾处的要求。1. 记住阿姆达尔定律:funccost是函数func运行时间百分比,funcspeedup是你优化函数的运行的系数。所以,如果你优化了函数TriangleIntersect执行40%的运行时间,使它运行快了近两倍,而你的程序会运行快25%。这意味着不经常使用的代码不需要做较多优化考虑(或者完全不优化)。这里有句俗语:让经常执行的路径运行更加高效,而运行稀少的路径正确运行。2. 代码先保证正确,然后再考虑优化这并不意味着用8周时间写一个全功能的射线追踪算法,然后用8周时间去优化它。分多步来做性能优化。先写正确的代码,当你意识到这个函数可能会被经常调用,进行明显的优化。然后再寻找算法的瓶颈,并解决(通过优化或者改进算法)。通常,改进算法能显著地改进瓶颈——也许是采用一个你还没有预想到的方法。所有频繁调用的函数,都需要优化。3. 我所了解的那些写出非常高效代码的人说,他们优化代码的时间,是写代码时间的两倍。4.跳转和分支执行代价高,如果可能,尽量少用。函数调用需要两次跳转,外加栈内存操作。优先使用迭代而不是递归。使用内联函数处理短小的函数来消除函数调用开销。将循环内的函数调用移动到循环外(例如,将for(i=0;i100;i++) DoSomething();改为DoSomething()?{?for(i=0;i100;i++)?{?…?}})。if…else if…else if…else if…很长的分支链执行到最后的分支需要很多的跳转。如果可能,将其转换为一个switch声明语句,编译器有时候会将其转换为一个表查询单次跳转。如果switch声明不可行,将最常见的场景放在if分支链的最前面。5. 仔细思考函数下标的顺序。两阶或更高阶的数组在内存中还是以一维的方式在存储在内存中,这意味着(对于C/C++数组)array[i][j]?和?array[i][j+1]是相邻的,但是array[i][j]?和array[i+1][j]可能相距很远。以适当的方式访问存储实际内存中的数据,可以显著地提升你代码的执行效率(有时候可以提升一个数量级甚至更多)。现代处理器从主内存中加载数据到处理器cache,会加载比单个值更多的数据。该操作会获取请求数据和相邻数据(一个cache行大小)的整块数据。这意味着,一旦array[i][j]已经在处理器cache中,array[i][j+1]很大可能也已经在cache中了,而array[i+1][j]可能还在内存中。6. 使用指令层的并行机制尽管许多程序还是依赖单线程的执行,现代处理器在单核中也提供了不少的并行性。例如:单个CPU可以同时执行4个浮点数乘,等待4个内存请求并执行一个分支预判。为了最大化利用这种并行性,代码块(在跳转之间的)需要足够的独立指令来允许处理器被充分利用。考虑展开循环来改进这一点。这也是使用内联函数的一个好理由。7. 避免或减少使用本地变量。本地变量通常都存储在栈上。不过如果数量比较少,它们可以存储在CPU寄存器中。在这种情况下,函数不但得到了更快访问存储在寄存器中的数据的好处,也避免了初始化一个栈帧的开销。不要将大量数据转换为全局变量。8. 减少函数参数的个数。和减少使用本地变量的理由一样——它们也是存放在栈上。9. 通过引用传递结构体而不是传值我在射线追踪中还找不到一个场景需要将结构体使用传值方式(包括一些简单结构如:Vector,Point和Color)。10. 如果你的函数不需要返回值,不要定义一个。11. 尽量避免数据转换。整数和浮点数指令通常操作不同的寄存器,所以转换需要进行一次拷贝操作。短整型(char和short)仍然使用一整个寄存器,并且它们需要被填充为32/64位,然后在存储回内存时需要再次转换为小字节(不过,这个开销一定比一个更大的数据类型的内存开销要多一点)。12. 定义C++对象时需要注意。使用类初始化而不是使用赋值(Color c(black);?比Color c; c = black;更快)13. 使类构造函数尽可能轻量。尤其是常用的简单类型(比如,color,vector,point等等),这些类经常被复制。这些默认构造函数通常都是在隐式执行的,这或许不是你所期望的。使用类初始化列表(Use?Color::Color() : r(0), g(0), b(0)?{},而不是初始

文档评论(0)

2232文档 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档