英语文献翻译关于片上多处理器.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
英语文献翻译关于片上多处理器

优化阵列密集型应用的片上多处理器摘要随着能源消费成为在计算机系统设计的第一级的优化参数之一同时考虑性能和能源编译技术有望发挥核心作用编制在性能和能源限制特定的应用程序代码正在成为一个重要问题在本文中,我们着重在一个片上多处理器架构和现在的代码优化策略设置。在一个嵌套循环的执行未使用的处理器被关闭我们先计算一个适应性循环并行化的战略潜在的能源节约措施我们的研究结果表明,关闭未使用的处理器可能导致高达的能源节约百分之的性能损失在阵列密集型应用程序设置为了消除这种性能损失,我们也讨论和评价一个处理器预激活策略编译时嵌套循环的分析。我们实验的基础上我们认为一个适应性循环并行化策略关闭闲置的处理器和预激活减少能源消耗执行时间不增加可以非常有效然后,我们概括我们的战略提出基于整数线性规划并行化战略(指令级并行)申请。给定一个数组密集型应用程序我们的优化策略决定了在执行目标函数每个循环嵌套处理器的数量由/程序员用户我们的基于约束的优化战略初步经验它是在多种能源和性能的限制优化阵列密集型应用程序的片上多处理器索引词片上多处理器,约束优化,嵌入式系统,能源消耗,自适应循环并行化,整数线性规划。作为移植系统级芯片()的变得越来越复杂足够的片上功率计算将多个处理器内核替代战略首先,多个简单的处理器内核组成的片上多处理器的设计一般比一个复杂的单处理器系统简单。这种简单也有助于减少在核查和验证所花费的时间。第二,一个片上多处理器预计将得到更好的硅空间利用率。额外的逻辑将用于寄存器重命名,指令唤醒,投机/预测,可用于提供片上多处理器更高的带宽单处理器寄存器旁路。第三,片上多处理器架构可以利用循环级在阵列密集型应用。与此相反,一个复杂的单处理器架构需要转换循环级并行指令级并行使用先进的(和耗电)战略。一些并行的损失是不可避免的。总体而言,一个片上多处理器阵列是一种用于执行密集的计算中常见的嵌入式图像和视频处理应合适的平台虽然VLIW /超纯量处理器可以提供一个(指令级)的并行性,和Nicol 指出,他们不扩展到未来的应用需要的性能,特别是在新一代的无线环境需要高水平的性能除此之外,这些建筑消耗的功率不呈线性比例的执行单元的数量有所增加。这是由于指令调度指令发出单大寄存器文件近日,自动循环并行化阵列密集型技术的应用开发已被证明是非常有效的我们认为,阵密集的嵌入式应用也可以从片上并行和一个片上多处理器提供低延时同步这一技术中获得显着。片上多处理器提高了执行上使用芯片并行应用程序的时间。一个应用程序可总是有一些程序的逻辑必须由另一颗处理器串行执行然而,在许多应用中,并行程序代码的某些部分。再比如说,有一处的循环代码花费的执行时间百分之如果这个循环迭代可以跨两个处理器划分,从而有一半是做了一个处理器,而另一半则同时在其他处理器同时进行,整个循环中可以一半的时间,在一个整体的执行时间减少了百分之。尽管这种说法有利于尽可能增加处理器数量之多,是有一定限度,超过这个使用较多的处理器实际上可能降低性能。这是因为,在许多情况下,需要并行循环间通信/同步。增加处理器数量这项活动量因此,在特定数量的处理器达到,增加处理器数量进一步显着增加通信/同步成本,更多的并行额外的好处可能无法抵消自适应并行是一个根据其固有的并行性每个部分代码的处理器数量编译器优化技术指导例如,给定的内部数据嵌套循环的依赖性可能会阻止我们使用的所有处理器。在这种情况下,尝试使用更多的处理器(除必要的)可能导致在执行时间的增加,增加间通信/同步成本。同样,一个小循环的约束,可能也表明,使用更少的处理器(不提供)来执行一个给定的循环。循环,特别是,自适应并行化优化范围因为一般来说,每一个特定的应用循环可能需要不同数量的处理器来实现其最佳的性能,改变整个循环的处理器数量大规模的高端并行机上的研究报告自适应闭环可最大限度地有效的利用处理器。当循环并行化是在给定的片上多处理器未使用(闲置)处理器可以关闭以节省能源。巢并行这样的策略可能会导致极大地节省能源。这是因为关闭一个处理器降低其动态和静态耗电。然而,人们必须付出“同步罚款”,放置到一个省电(休眠)状态的处理器被要求参加计算。这种成本的大小取决于把从断电状态的处理器回来所花费的时间。以确保它已准备好时,它需要执行下一个计算。这种预激活策略可以,如果成功,消除了由于同步的性能损失,降低能源消耗。即使一个人只注重性能,不得利用循环巢选择了在并行处理器数量可能是微不足道。当我们考虑在同时多个目标函数,这个问题变得更加难以解决。再比如说,我们想尽量使用并行减少给定能源循环延时产品。为了决定使用的处理器数量,我们需要评估增加对能源消耗和执行周期的处理器数目的影响。如果使用更多的处理器并没有带来显着的执行时间减少,能源延迟产品可能会受到影响,因为使用更多的处理器意味着更多

文档评论(0)

shenlan118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档