VTuneAmplifierXE算法分析类型主要包括四个部分.ppt

VTuneAmplifierXE算法分析类型主要包括四个部分.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
VTuneAmplifierXE算法分析类型主要包括四个部分.ppt

Intel(R) VTune(TM) Amplifier XE简介;;;VTune Amplifier XE算法分析类型主要包括四个部分:;算法分析功能说明;;;;;;分析数据;CPU利用直方图,显示CPU同时被利用的个数及时间;展开Bottom up窗口,可以看到最占时间的函数,点击右键,选择view source 能看到对应的C代码和汇编代码及运行时间;可以适当的更改程序,如循环的嵌套顺序,将更改后的程序与原程序对比,可以观察性能的改进;1 时间轴 2 运算时的线程 3 CPU的利用率;Amplifier所能分析的种类,其中除算法分析外,都需要有相应的硬件支持,即需要对硬件采样。; 设计过程中可先考虑并发性,而因硬件结构不同而做的改动最后考虑。可分为四部分:划分partitioning:将要执行的运算和数据拆分,分成一个个小的任务;通信communication:适当的通信能确保运算能完成;凝结agglomeration:将一些联系紧密的任务划连接成较大的任务;映射mapping:根据硬件结构来将运算映射完成。; 除了运算时间和关键部分的可扩展性,还需考虑数据的产生机制、存储机制、传输网络、如何从读取、不同阶段间的传输。 因此,性能的评价标准应包括:运行时间,并行效率,存储需求,数据吞吐量、数据等待时间,输入输出比例。这些都可以通过Vtune Amplifer来分析,只是硬件的开销等涉及可重构处理器的硬件的指标需要其他分析方法。;Thank You !

文档评论(0)

170****0532 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8015033021000003

1亿VIP精品文档

相关文档