- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于矩阵乘优化验证两种矩阵乘优化方法矩阵分块和循环展开混合使用能否实现优化目的;用SSE指令或AVX指令优化矩阵乘;使用GCC编译器自带的优化功能优化矩阵乘.(1)(1)
实验任务(2),(3)
实验任务(2),(3)
实验截图:
实验任务一结果截图:
实验任务二结果截图:
矩阵乘128*128优化前后时间对比(共十次实验)
矩阵乘256*256优化前后时间对比(共十次实验)
矩阵乘512*512优化前后时间对比(共十次实验)
三参数说明:
矩阵乘1024*1024在不同优化级别上的执行时间
矩阵乘1025*1025在不同优化级别上的执行时间
矩阵乘2048*2048在不同优化级别上的执行时间
矩阵乘2049*2049在不同优化级别上的执行时间
实验任务(1)结果分析:
优化级别及运行时间 矩阵乘规模 循环展开 分块循环展开 128*128 0.015s 0.016s 0.00s 256*256 0.203s 0.093s 0.125s 512*512 1.359s 0.844s 0.688s 1024*1024 40.4s 26.392s 20.251s 说明:循环展开是内层循环每次做4个乘法;
分块是分成4块;
分块循环展开是分成4块,然后内层循环每次做个4个乘法。
通过以上表格对比发现,结合分块和循环展开的矩阵乘拥有更好的优化效果。
实验任务(2)结果分析:
Intel公司的单指令多数据流式扩展(SSE,Streaming SIMD Extensions)技术能够有效增强CPU浮点运算的能力,而SIMD(single-instruction, multiple-data)是一种使用单道指令处理多道数据流的CPU执行模式,即在一个CPU指令执行周期内用一道指令完成处理多个数据的操作,所以使用SSE指令矩阵乘进行优化能提高矩阵乘的性能.
矩阵乘128*128在优化之前的平均运行时间约为19ms,使用SSE指令优化之后平均运行时间为16ms.优化效率为(19-16)/19=15.7%.
矩阵乘256*256在优化之前的平均运行时间约为126.4ms,使用SSE指令优化之后平均运行时间为95ms.优化效率为(126.4-95)/126.4=24.8%.
矩阵乘512*512在优化之前的平均运行时间约为1097.8ms,使用SSE指令优化之后平均运行时间为759.8ms.优化效率为(1097.8-759.8)/1097.8=30.8%.
可以看出,随着矩阵乘规模的增大,SSE指令优化的效果在不断提高.
实验任务(3)结果分析:
优化级别及运行时间 矩阵乘规模 O0 O1 O2 O3 优化效率(O3) 1024*1024 31.92s 12.8s 13.1s 12.9s 59.5% 1025*1025 7.44s 2.07s 2.05s 2.06s 72.3% 2048*2048 266.6s 117.7s 117.8s 117.9s 55.8% 2049*2049 59.2s 18.35s 18.46s 18.52s 68.7% 从实验结果可以看出,排除噪声干扰不同级别的优化结果基本一致,并且不同规模的矩阵乘优化效率不一样,如果矩阵乘规模是cache块大小的整数倍则优化效率较低.
您可能关注的文档
最近下载
- Q∕SH 0102-2007 中国石化物料分类与代码.pdf
- 第1章 勾股定理——问题解决策略:反思(课件)2025-2026学年度北师大版数学八年级上册.pptx VIP
- 免疫规划知识培训课件.pptx VIP
- 创伤后机体反应及基本的创伤支持.ppt VIP
- 六年级上册信息技术浙教版第3课算法设计(教案).pdf VIP
- 平面向量单元测试题.doc VIP
- 野外驻训卫生防病【28页】.pptx VIP
- 合同协议-付款协议.doc VIP
- 2025年版中国药典微生物限度检查方法验证方案分析.doc VIP
- DB11T 1598.8-2020 居家养老服务规范 第8部分:呼叫服务.docx VIP
文档评论(0)