- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高性能处理器体系结构DataLevelarallelarchitecture数据并行体系结构
* * Intel MMX: Basics Most multimedia apps work on short integers Pack data into 64-bit words Bytes 8bits Words 16 bits Double words 32 bits Operate on packed data like short vectors (SIMD) * * MMX Extension MMX registers: 64-bit MM0 to MM7 shared with FP registers R0, R7, has side-effect on FPU state, only use for operands Four MMX data types: 64-bit / 32-bit access mode from memory to MMX registers SIMD techniques for arithmetic/logical operations on bytes, words, doublewords from/to 64-bit registers 0 63 Packed Byte 8x8 Packed Word 16x4 Packed Doubleword 32x2 Quadword 64 MMX Register * * MMX Instruction Set MMX instruction set consists of 57 instructions, group into 7 categories: Arithmetic instructions Data transfer instructions Comparison instructions Conversion instructions Logical instructions Shift instructions Empty MMX state instruction (EMMS) Minimizes ISA changes Can improve performance up to 8x (in theory) benchmark perf not 8x, but very good and gives customers another reason to consider their current PC obsolete. * * MMX Instruction Set * * MMX Instruction Set - Arithmetic Overflow/underflow for Wraparound: truncated; for Saturation: set to the maximum/minimum value, useful for graphics Packed multiplication: perform four multiplications on pairs of 16-bit operands, producing 32-bit results; PMULHW / PMULLW writes high-order / low-order 16 bits of results to destinations Packed multiply add: multiply 4 16-bit pair of sources and destinations; four 32-bit results are summed in pairs Arithmetic Wraparound Signed saturation Unsign saturation Addition PADD(b,w,d) PADDS(b,w) PADDUS(b,w) Subtraction PSUB(b,w,d) PSUBS(b,w) PSUBUS(b,w) Multiplication PMUL(lw,hw) Multiply and Add PMADDWD * * Example:Packed Multiply Add 4 multiplications and 2 adds in one PMADDWD PMADDWD produces 2 DW (32 bits) results Useful inst. for many media and signal applications Need arrange and pack input / output results to/from MMX registers, add prog
您可能关注的文档
- 马拉西亚一年级华文字理识字读本43.doc
- 马拉西亚一年级华文字理识字读本42.doc
- 马拉西亚一年级华文字理识字读本44.doc
- 高一化学第二节几种重要的金属化合物铝的化合物.ppt
- 高一化学课件化学物质及其变化第节氧化还原反应.ppt
- 高一化学课件富集在海水中的元素氯时.ppt
- 高一化学课件第4章非金属及其化合物第1节无机非金属材料的主角硅第2课时24.ppt
- 高一化学课件金属及其化合物第节几种重要的金属化合物铁的化合物.ppt
- 高一化学课件金属及其化合物第节用途广泛的金属材料.ppt
- 高一化学课件非金属及其化合物第节无机非金属材料的主角硅时.ppt
- 高性能处理器体系结构ThreadLevelarallelArchitectureTL导论.ppt
- 高性能处理器体系结构TLSharedMemorymultirocessors共享存储多处理器.ppt
- 高性能处理器体系结构TL推测多线程和事务存储.ppt
- 高性能处理器体系结构推测执行值预测和指令重用技术.ppt
- 高性能处理器体系结构可重构计算和多型计算.ppt
- 高性能处理器体系结构推测执行分支预测技术.ppt
- 高性能处理器体系结构虚拟机Virtualmachines导论.ppt
- 高效液相色谱分析法第一节高效液相色谱的特点与仪器.ppt
- 高教版商品学第一章商品质量和商品标准.ppt
- 高教版商品学第三章商品分类.ppt
最近下载
- 总工办工作总结.pptx VIP
- 公共建筑工程施工设计方案.doc VIP
- 半导体光催化基础第二章半导体表面与表态-第一讲.ppt VIP
- 大学生就业指导(第4版)PPT全套完整教学课件.pptx VIP
- 《简单相信,傻傻坚持》-中职语文高二同步课件精选(高教版2023职业模块).pptx VIP
- 《环境影响评价》全套教学课件.pptx
- 建设工程招投标与合同管理:建设工程施工合同PPT教学课件.pptx VIP
- 《电子信息工程导论》03 计算之芯.pptx VIP
- 第一单元万物互联的奥秘第一节互联到物联+课件+2025-2026学年川教版(2024)+初中信息科技+八年级上册.pptx VIP
- 最新最全四年级《道德与法治》上册 .pdf VIP
文档评论(0)