网站大量收购独家精品文档,联系QQ:2885784924

CPU及GPU,还有生活.docxVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CPU 和 GPU, 还有生活 许久没有写技术方面的日志了。这段时间本想出去好好的散心,过年在老家转了一圈,去了一趟大足。本想去大足石刻看看,到佛湾走走,结果行程都在车上浪费了,到大足的时候,已经是下午4点多。本想回家的,第二天朋友还得去成都找他朋友,结果没车了,只能就地找了一家酒店。一家邮政酒店,说是酒店,或许就是以前的办公大楼改造的,一台电视,两张床,其他的没了……晚上在大足转了一圈,或许是我们太不熟悉,没找到什么好玩的,也就回到酒店,聊聊天,睡了。晚上很冷,半夜冻醒了,起床加了一床毛毯。旁边床的兄弟第二天早上起来的时候,直大喷嚏……一大早,回到家……走亲戚,串门……没有能见到几个同学,见到的,有的已经带着孩子打酱油了。家里面聚餐的时候,都追问个人问题,哎!本想回家可以清净一些,还是逃不过吧。或许这就是生活……琐碎而繁杂。 几个月没什么心情写论文,没心情看技术方面的文章,看了不少其他的书,道家,儒家的书,看了一些,不过感觉自己还没入门,只是先看看吧,心烦意乱的时候,可以让自己安静下来。或许在写代码的时候,怎么规划内存,怎么布局,这些逻辑思维也可以从看的非技术书里面来吧。修心比修脑更重要吧。心通了,心静了,脑子或许才能清醒吧。熬了几个星期的通宵,5点多总算把论文赶完了。一篇大数处理的文章,GPU单线程比CPU快乐几十倍,当然,这个需要大量数据的时候,要是数据小了,GPU一点不占优势。 有的时候写代码或许就跟生活差不多,开始设计算法,解决问题的时候,总是觉得千丝万缕,琐碎而繁杂,不知道从哪里入手,不知道从哪个地方找到适合自己生活的方式。知道GPU上面优化的东西就这么多,知道遇到的问题有一些什么特点,但是就是不知道从那一部分直接入手最容易,最能直接到核心问题。找到一个逻辑,很难。生活中找到真正适合自己的,也很难。想不明白的时候,或许选择逃避,或许选择尝试,不停地尝试吧。一个kernel函数从最开始的验证版本,到最后的相对自己认为的最优的版本,可能中间过程经历了10次的修改。过一段时间还会发现有新的想法,新的思路可以尝试。当我找不到规律的时候,就一条一条路的走一下,或许我知道没有别人聪明,也不是像别人那么运气好,也没有偷懒的资本。那就先用广度优先,找出所有的解决办法吧,或许有一天找到一些规律的时候,再来简化自己的步骤,再来尝试退火算法的方式找最优解,或许采用A*算法的思路来找最优解。或许吧, HYPERLINK javascript:; \t _self 人生的经历或许也差不多吧,不清楚地时候,不明白的时候,现在按照已有的方式走下来吧。要是能有高人指点一下,那就最好了,要是么有,那还是都尝试一下吧。当然,要是想糊糊涂涂的过一辈子,那也就糊糊涂涂的解决就行了。记得理工大学南门有一个酒吧,叫做七又二分之一,当时不知道为什么叫这个名字,就问朋友。他说,在佛语里面有偷得浮生半日闲。或许7天纷繁复杂的生活之后,给自己半天的时间,思考和总结吧。或许算法优化的过程也不过如此吧。尝试了很多种途径之后,就是总结和归纳,找到一些相似的地方,找到一些不会发现的情况,找到一些通往最终目标的捷径。生活需要积累,学习,也需要积累吧。 闲下来,道家,儒家的书也看不进去的时候,就打打星际2.星际我最爱玩虫族,不为别的,就为可以疯狂的造小狗,一窝蜂的小狗过去,一轮一轮的24只小狗过去,我看现在还没那个AI能扛得住的。或许这个也像现在的GPU跟CPU吧。每一个小狗就是GPU里面的一个计算核心,每一个人族或者神族的尖锐部队,就像CPU里面的核心,确实人族的坦克很厉害,小狗可以挂一片,但是一群几十只小狗围着的时候,坦克挂得相当的快。GPU就占着人多吧。但是要是小狗串行的过去靠近坦克,小狗只有来一个挂一个了。所以,要并行的效果,才能搞定坦克,,o(╯□╰)o,囧……一窝蜂的围攻才行,所以在考虑GPU算法的时候,或者并行算法的时候,一定要考虑,你的算法是并行的,最大并行化的,什么叫最大并行化。大家都做差不多的事情,做事情的时候,干扰很小,或者各自之间都没干扰,然后大家都可以同时围绕着坦克,同时攻击坦克四周,就好比GPU里面取内存的时候,16线程,half-warp一起访问内存,就可以合并访问一样,一群小狗都同时能靠近坦克,同时攻击的时候,打起来超帅。。。一会就磕掉一个。。 但是要是人族的坦克也成对了,提升了坦克的装甲,提升了坦克的攻击能力,每个坦克+上都是3防,3攻,只要门口附近摆上4门坦克,那一群随即的小狗跑过去,还不行的,也只会挂在门口。这就好比要是在CPU里面优化的时候,用SSE优化,提高攻击力+3。再打开多线程,就好比在门口加上几门坦克。这些功能都是需要慢慢调试出来的。就像我们写CPU优化的代码的时候,SSE的代码接近汇编,调试起来很麻烦,相对而言,GPU造

文档评论(0)

185****7617 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档