英特尔手册附录C.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
英特尔手册附录C

附录 C INTEL? C/C++ 内置函数及函数替换 1 该附录中的两张表列出了Intel C/C++编译器针对MMX技术,SSE,SSE2,SSE3,SSSE3指令的内置函数和函数替换. 可能有些新增的内置函数并没有相应的指令替换.请查阅编译器文档中列出的所有支持的内置函数 HYPERLINK /support/performancetools/ /support/performancetools/. 表C-1列出的是简单的内置函数,表C-2列出的复合内置函数.某些内置函数是复合的,因为这时需要多于一条指令去实现它们. Intel C/C++编译器内置函数均依照以下约定: _mm_intrin_op_suffix 其中: intrin_op 指示内置函数的基本操作; 如, add为加,sub为减 suffix 表示指令的操作数类型.开头的一两个字母指示数据是否是紧缩(packed p), 扩展紧缩(extended packed ep), 或者标量( scalar s). 剩下的字母记录类型: s 单精度浮点数 d 双精度浮点数 i128 128位有符号整数 i64 64位有符号整数 u64 64位无符号整数 i32 32位有符号整数 u32 32位无符号整数 i16 16位有符号整数 u16 16位无符号整数 i8 8位有符号整数 u8 8位无符号整数 而r一般被用作内置函数的返回值.紧跟一个数字指示一个紧缩对象的元素.如r0表示r的最低字. 紧缩值以从右到左的顺序描述,最低值被用作标量操作.考虑以下操作: double a[2] = {1.0, 2.0}; m128d t = _mm_load_pd(a); 结果和以下操作相同: m128d t = _mm_set_pd(2.0, 1.0); m128d t = _mm_setr_pd(1.0, 2.0); 换句话说,暂存变量t的MMX寄存器就像下图所示的样子: 2.0 1.0 127 64 63 0 标量元素即1.0.由于指令本身的关系,某些内置函数需要立即数(整形字面常量)参数. 为了使用内置函数,你可以按照下面的样子在你的代码中插入一行: data_type intrinsic_name (parameters) 其中: data_type 返回值的类型,可以是void, int, m64, m128, m128d, 或者 m128i. 仅有 _mm_empty 内置函数 返回 void. intrinsic_name 内置函数的名称.它可以在源代码中表现为函数而不是内联实际指令. parameters 内置函数需要的参数. C.1 简单内置函数 注 如要查看表C-1中内置函数的详细描述,请查阅《Intel? 64 和IA-32架构软件开发者手册 第2卷 A》第3章“指令集参考, N-Z” 或《Intel? 64 和IA-32架构软件开发者手册 第2卷 A》第4章“指令集参考, N-Z”. 表 C-1. 简单内置函数 助记符 内置函数 ADDPD __m128d _mm_add_pd( m128d a, m128d b) ADDPS __m128 _mm_add_ps( m128 a, m128 b) ADDSD __m128d _mm_add_sd( m128d a, m128d b) ADDSS __m128 _mm_add_ss( m128 a, m128 b) ADDSUBPD m128d _mm_addsub_pd( m128d a, m128d b) ADDSUBPS m128 _mm_addsub_ps( m128 a, m128 b) ANDNPD m128d _mm_andnot_pd( m128d a, m128d b) ANDNPS m128 _mm_andnot_ps( m128 a, m128 b) ANDPD __m128d _mm_and_pd( m128d a, m128d b) ANDPS __m128 _mm_and_ps( m128 a, m128 b) BLENDPD __m128d _mm_blend_pd( m128d v1, m128d v2, const int mask) BLENDPS m128 _mm_blend_ps( m128 v1, m128 v2, const int mask) BLENDVPD m128d _mm_blendv_pd( m128d v

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档