- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
?
HYPERLINK /housisong/article/details/6324467 \o 高级语言内的单指令多数据流计算(SIMD) 高级语言内的单指令多数据流计算(SIMD)
分类:? HYPERLINK /housisong/article/category/232185 代码优化2011-04-14 23:01?1771人阅读? HYPERLINK /housisong/article/details/6324467 \l comments 评论(17)? HYPERLINK javascript:void(0); \o 收藏 收藏? HYPERLINK /housisong/article/details/6324467 \l report \o 举报 举报
????????????高级语言内的单指令多数据流计算(SIMD)????????????? HouSisong@GM?? 2011.04.14tag:单指令多数据流计算,SIMD摘要:?? 很多年来,x86体系的CPU增加的新指令集大多都是SIMD指令(和相应的寄存器);然而很容易忽视的是,我们在高级语言内也能进行很多SIMD类计算!正文:???? 单指令多数据流,Single Instruction Multiple Data,简写为SIMD,就是说用一个指令同一时间处理多个数据;????? 很多年来,x86体系的CPU增加的新指令集大多都是SIMD指令(和相应的寄存器);比如MMX,3DNow!,MMX2,SSE,SSE2,SSE3,SSSE3,SSE4,AVX等等;??? 不用借助这些高级指令集和其特殊寄存器,我们在高级语言范围内,也能进行很多SIMD类似的计算;????问题一?: 对一个字节流的每一个数据进行右移1位?? 一般的代码:? (当然,输出数组也可以是另外一个数组,下同)
HYPERLINK /housisong/article/details/6324467 \o view plain view plain
uint8?a[10000];??
for?(int?i=0;i10000;++i)??
????a[i]=a[i]1;??
?? 使用SIMD思路的代码(4路数据流同时计算):
HYPERLINK /housisong/article/details/6324467 \o view plain view plain
uint8?a[10000];??
uint32*?a32=(uint32*)a;?//实际代码可能需要考虑内存访问对齐和边界处理问题,下同??
for?(int?i=0;i2500;++i){??
????uint32?c=a32[i]0xFEFEFEFE;??
????a32[i]=c1;??
}??
?? 明白了这里的实现原理,那么对于其他右移位数/左移/双字节数据也能同理处理了;?? 其他几个问题也一样可以举一反三;?? 提示: 如果软件运行在64位模式,那我们就能一次处理更多的数据!问题二?: 对一个字节流的每一个数据x,计算255-x?? 一般的代码:
HYPERLINK /housisong/article/details/6324467 \o view plain view plain
uint8?a[10000];??
for?(int?i=0;i10000;++i)??
????a[i]=255-a[i];??//我见过的一个处理图像颜色取反的代码??
?? 使用SIMD思路的代码(4路数据流同时计算):
HYPERLINK /housisong/article/details/6324467 \o view plain view plain
uint8?a[10000];??
uint32*?c=(uint32*)a;??
for?(int?i=0;i2500;++i){??
????a32[i]=~a32[i];??
}??
问题三?: 求两个字节流的平均字节流?? 一般的代码:
HYPERLINK /housisong/article/details/6324467 \o view plain view plain
uint8?a[10000];??
uint8?b[10000];??
for?(int?i=0;i10000;++i)??
????a[i]=(a[i]+b[i])1;//我见过的一个处理图像颜色50%混合的代码??
?? 使用SIMD思路的代码(2路数据流同时计算):
HYPERLINK /housisong/article/details/6324467 \o view plain view plain
u
您可能关注的文档
- 《烟叶工商交接等级质量监督抽查管理办法》.doc
- 适合市民培植盆栽蔬菜.doc
- 自体脂肪填充后注意事项.docx
- 书籍印刷词汇.doc
- C代码优化方案.docx
- 川大网教《培训开发与职业发展》第一次作业答案.doc
- 安全生产三级安全网及四级控制办法.doc
- 火电行业经营状况分析.doc
- 我国电力建设集团有限企业职工违纪违规处罚暂行规定.docx
- 常用网络语言大全及含义(不收藏你就out了!).doc
- 黑龙江省龙东联盟2025-2026学年高二上学期10月月考政治试题(原卷版).pdf
- 安徽省蚌埠市A层高中2025-2026学年高二上学期10月月考语文试题(含答案).docx
- 四川省成都市石室中学2025-2026学年高三上学期10月月考语文(含答案).pdf
- 辽宁点石联考2025-2026学年高一上学期10月月考考试英语试题(解析版).pdf
- 江西省吉安市七校联考2025-2026学年高三上学期10月月考政治试题(含答案).pdf
- 辽宁点石联考2025-2026学年高一上学期10月月考考试语文试题含答案.docx
- 黑龙江省龙东联盟2025-2026学年高二上学期10月月考政治试题(原卷版).docx
- 辽宁点石联考2025-2026学年高一上学期10月月考考试英语试题(原卷版).pdf
- 黑龙江省龙东十校联盟2025-2026学年高二上学期10月月考历史试题(含答案).pdf
- 重庆市金太阳好教育联盟2026届高三10月联考(26-65C)英语(含答案).pdf
文档评论(0)