高级语言内单指令多数据流计算(SIMD).docxVIP

高级语言内单指令多数据流计算(SIMD).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
? HYPERLINK /housisong/article/details/6324467 \o 高级语言内的单指令多数据流计算(SIMD) 高级语言内的单指令多数据流计算(SIMD) 分类:? HYPERLINK /housisong/article/category/232185 代码优化2011-04-14 23:01?1771人阅读? HYPERLINK /housisong/article/details/6324467 \l comments 评论(17)? HYPERLINK javascript:void(0); \o 收藏 收藏? HYPERLINK /housisong/article/details/6324467 \l report \o 举报 举报 ????????????高级语言内的单指令多数据流计算(SIMD)? ???????????? HouSisong@GM?? 2011.04.14 tag:单指令多数据流计算,SIMD 摘要: ?? 很多年来,x86体系的CPU增加的新指令集大多都是SIMD指令(和相应的寄存器); 然而很容易忽视的是,我们在高级语言内也能进行很多SIMD类计算! 正文:? ??? 单指令多数据流,Single Instruction Multiple Data,简写为SIMD,就是说用 一个指令同一时间处理多个数据;?? ??? 很多年来,x86体系的CPU增加的新指令集大多都是SIMD指令(和相应的寄存器); 比如MMX,3DNow!,MMX2,SSE,SSE2,SSE3,SSSE3,SSE4,AVX等等; ??? 不用借助这些高级指令集和其特殊寄存器,我们在高级语言范围内,也能进行 很多SIMD类似的计算; ???? 问题一?: 对一个字节流的每一个数据进行右移1位 ?? 一般的代码:? (当然,输出数组也可以是另外一个数组,下同) HYPERLINK /housisong/article/details/6324467 \o view plain view plain uint8?a[10000];?? for?(int?i=0;i10000;++i)?? ????a[i]=a[i]1;?? ?? 使用SIMD思路的代码(4路数据流同时计算): HYPERLINK /housisong/article/details/6324467 \o view plain view plain uint8?a[10000];?? uint32*?a32=(uint32*)a;?//实际代码可能需要考虑内存访问对齐和边界处理问题,下同?? for?(int?i=0;i2500;++i){?? ????uint32?c=a32[i]0xFEFEFEFE;?? ????a32[i]=c1;?? }?? ?? 明白了这里的实现原理,那么对于其他右移位数/左移/双字节数据也能同理处理了; ?? 其他几个问题也一样可以举一反三; ?? 提示: 如果软件运行在64位模式,那我们就能一次处理更多的数据! 问题二?: 对一个字节流的每一个数据x,计算255-x ?? 一般的代码: HYPERLINK /housisong/article/details/6324467 \o view plain view plain uint8?a[10000];?? for?(int?i=0;i10000;++i)?? ????a[i]=255-a[i];??//我见过的一个处理图像颜色取反的代码?? ?? 使用SIMD思路的代码(4路数据流同时计算): HYPERLINK /housisong/article/details/6324467 \o view plain view plain uint8?a[10000];?? uint32*?c=(uint32*)a;?? for?(int?i=0;i2500;++i){?? ????a32[i]=~a32[i];?? }?? 问题三?: 求两个字节流的平均字节流 ?? 一般的代码: HYPERLINK /housisong/article/details/6324467 \o view plain view plain uint8?a[10000];?? uint8?b[10000];?? for?(int?i=0;i10000;++i)?? ????a[i]=(a[i]+b[i])1;//我见过的一个处理图像颜色50%混合的代码?? ?? 使用SIMD思路的代码(2路数据流同时计算): HYPERLINK /housisong/article/details/6324467 \o view plain view plain u

文档评论(0)

汪汪队 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档