- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
cpugpu异构多核虚拟执行环境框架的设计与实现word格式论文
CPU/GPU异构多核虚拟执行环境框架的设计与实现摘要近几年来,拥有着强大并行处理能力的GPU(Graphic Process Unit)得到 了飞速的发展,从而也使得CPU/GPU的架构越来越流行。 目前除了使用显式的 编程方法比如NVIDIA提供的CUDA(Compute Unified Device Architecture)以 及AMD的Stream SDK外,我们并无其它方式来挖掘GPU的并行处理能力。然而在使用显式编程的过程中我们也会碰到重写源代码的耗时问题跟二 进制不兼容性问题。 一方面,当前有着很多的计算型密集型程序是采用C、 C++或其它高级编程语言编写,而这些应用如果想要使用GPU的并行处理能力 来缩短程序的执行时间,那么采用显式编程的方式来修改或是重写整个源代码 是不可避免的,而更为糟糕的是有些时候我们根本拿不到程序的源代码;另一 方面,即使这些应用的源代码按要求被重写后也会产生二进制不兼容性问题: 一个在显式编程环境下编译的可执行程序在不同厂商,哪怕是同一厂商的不同 型号GPU上将无法或无法正常运行。为了解决重写源代码的耗时跟二进制不兼容性问题,本文的研究目的是通 过扩展自主研发的多源多目标的动态二进制翻译系统Crossbit来提供一种虚拟 执行环境,既能有效地解决重写源代码的问题,亦能自动地使用GPU的强大并 行处理能力,最终使得部分的计算密集型应用获得5-8倍的性能提升。 其原理 是通过静态与动态的二进制分析技术从二进制文件中提取潜在的可并行代码, 然后通过多面体模型分析将那些没有数据依赖的可并行代码并将其放到GPU上 加速,最终将执行结果拷贝到主存的相应位置,而那些不可以放到GPU上执行 的部分则采用正常的动态二进制翻译执行。 由于计算密集型应用的大部分时间 用于计算,因而GPU的加速性能使得这些应用的整体性能得到了很大的提升。本文的主要创新点和意义在于:1)提出一种适合于计算密集型应用的虚 拟执行环境,有效地屏蔽了使用显式编程去重写源代码来使用GPU的问题;2) 利用二进制分析技术与多面体模型提取二进制可执行程序中的可并行部分,为 之后的GPU加载并执行这些可并行部分提供了准确的定位;3)通过挖掘GPU— i —上海交通大学硕士学位论文CPU/GPU异构多核虚拟执行环境框架的设计与实现的强大并行处理能力,有效地提高了计算型密集型应用的性能。关键词: 虚拟执行环境,多面体模型,二进制翻译ii —The Design and Implementation of Virtual Execution Environment Framework for GPU/CPU Heterogeneous Multi-coreABSTRACTIn recent years, the rapid development of GPU causes CPU/GPU architecture to become increasingly popular because of GPU’s powerful parallel processing capabil- ity. However, we have no other methods of using that capability of GPU except for CUDA and Stream SDK provided by NVIDIA and AMD respectively, which are all based on explicit programming.There are several constraints for explicit programming: the cost of rewriting the source code as well as binary incompatibility. On one hand, as there are so many computation-intensive programs that are written by advanced programming language such as C, C++, if we want to execute these applications using GPU’s powerful parallel capability to shorten the executing time, rewriting the source code is inevitable and the worse situation is that sometimes we cannot get the source code. On the other hand, e
您可能关注的文档
- buyandsell模式下vs公司的采购策略研究word格式论文.docx
- burkholderia thailandensis e264生产抗癌药物thailandepsina的分析word格式论文.docx
- bv国际检验集团合规管理分析word格式论文.docx
- bwdsp100编译器的研制及优化技术分析word格式论文.docx
- bx公司员工激励问题分析word格式论文.docx
- by公司pc工厂停车安全检修项目管理分析word格式论文.docx
- by公司的运营流程优化分析word格式论文.docx
- bs模式的住房公积金综合信息系统设计与实现word格式论文.docx
- bz化学振荡反应及其在苯胺类物质检测中的应用word格式论文.docx
- bz化学振荡反应在研究检测中的应用word格式论文.docx
- cpu风冷散热器的实验分析及流场和温度场的数值模拟word格式论文.docx
- cpw倒置变换器的分析及其在滤波器中的应用word格式论文.docx
- cpw空气桥的分析及其在定向耦合器中的应用word格式论文.docx
- cp型单螺杆压缩机关键技术分析及内流场模拟word格式论文.docx
- cp医院管理公司商业模式分析word格式论文.docx
- cqu出版社生产运作管理分析word格式论文.docx
- cpu热柱散热器的实验分析及流场和温度场的数值模拟word格式论文.docx
- cp集团投资项目评价体系重构——以工程建设投资项目为例word格式论文.docx
- cpw空气桥及其在不连续性结构中的应用分析word格式论文.docx
- cr as cd pb复合污染对茶树叶片生理特性的研究word格式论文.docx
最近下载
- T2DM合并卒中患者血糖管理专家共识解读.pptx VIP
- 专题二 二次根式新题型——二次根式为载体的阅读材料题(含答案析)(专题二 二次根式新题型-下学期八年级数学下册期末复习高频考点专题(人教版)).docx VIP
- 脑卒中的危险因素.pptx
- 规范食品检测样品采集操作流程.docx VIP
- 《平面构成》(张玥)679-1 教案 第6课 形象构成.docx VIP
- 工艺设备变更管理规范.pptx VIP
- 北师大版七年级上数学第四章测试题含答案.docx VIP
- 2025年5月国培卫健、粤医云基层卫生管理提升项目(临床)参考答案.docx VIP
- 初中数学教师评职称个人工作总结.docx VIP
- 2024年幼儿园小班语言《动物宝宝去旅行》PPT 优质课件.pptx VIP
文档评论(0)