分布式内存多核处理器流程序虚拟机分析-virtual machine analysis of distributed memory multi-core processor streaming program.docxVIP
- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式内存多核处理器流程序虚拟机分析-virtual machine analysis of distributed memory multi-core processor streaming program
1绪论1.1研究目的及意义多核处理器的出现[1],给DSP、多媒体处理和科学计算等数据和计算密集型应用带来新的契机。多核处理器在满足对数据进行实时和高效处理的同时,也给并行编程带来了巨大的挑战。利用传统的编程模型,编程人员需要进行同步处理、任务调度和核间通信等繁琐的工作,因此,程序的性能受限于编程人员对并行算法和并行系统结构的了解。流编程模型是针对当前数据和计算密集型应用特性而设计的一种新型编程模型,它根据密集计算领域数据处理的特点,采用流的方式对应用程序进行处理,从而降低编程的复杂性。流编程作为一种高效的并行编程模型提供了显式的并行性,它将计算和数据通信分离,零散的数据被封装成连续的数据序列,在计算开始之前,提前传输到处理单元的本地存储器(LocalMemory,LM),从而隐藏数据的传输延时。流程序可以串行编写,然后由编译器自动并行化并有效地映射到流处理器上。当前,各大芯片厂商和科研机构都研制出各自的流处理器来支持流应用。这类流处理器包括基于片上存储的VIRAM[2]、片内多处理机RAW[3]及TRIPS[4]、SIMD流处理器Imagine[5]及Merrimac[6]、CELL处理器[7]和图形图像处理器[8]等。针对流处理器开发的流编程语言大多是对C/C++或Java语言的扩展,加入专门的指令或编译指示符来对并行数据和并行操作进行标记。现有的或正在开发的流编程语言有很多,如同步数据流语言StreamIt[9]及Simulink[10]、多维流语言Brook[11]、数组语言Matlab[10]和3D流编程语言OpenCL[12]等。这些流编程语言是针对特定平台开发的,如StreamIt是在RAW上开发的,Brook是在Merrimac上开发的,而OpenCL是在GPU上开发的。为了在某一流体系结构上运行流应用程序,就必须为每一种流编程语言和流体系结构的组合设计专门的编译器。流程序虚拟机[13](StreamprogramVirtualMachine,SVM)主要用于解决流应用程序跨平台的问题。它把编译过程分成两个阶段:高层编译器(High-LevelCompiler,HLC)和低层编译器(Low-LevelCompiler,LLC)阶段。HLC针对专门的编程语言,允许应用程序不针对特定的流体系结构进行编写。LLC针对特定的流体系结构进行优化产生可执行代码。SVM支持流应用程序用高级语言编写,由编译器自动将应用程序分解成流和流计算,然后映射到处理单元、内存及通信渠道。流程序虚拟机目前发展尚不成熟,特别是对分布式内存多核处理器的支持较少。随着CELL处理器和CPU-G80[8]等异构并行处理平台系统的出现,异构多执行核处理器已经成为多核处理器的发展主流。当前对高性能的要求,大规模片上多核处理器更是研究的热点[14-16]。异构多执行核处理器和大规模片上多核的大量并行资源和本地片上存储等特性为流编程模型提供了强大的硬件支持。流程序虚拟机对分布式内存核处理器的有效支持,有利于降低分布式内存多核处理器编程的复杂性,提高编程效率和程序性能,从而加速流应用编程技术的发展。1.2国内外研究现状1.2.1流编程模型及编译技术流编程模型最初是针对流处理器设计的,为了提高在流处理器环境下的编程效率而提出的一种编程模型。流编程模型将具体的应用分解成若干个对大量数据流进行处理的流计算操作,每个流计算操作是一个单程序多数据(SingleProgramMultipleData,SPMD)的核函数,它的输入/输出是一组连续的数据序列,同一数据序列中的元素具有相同的数据类型。核函数对输入数据序列进行处理,产生的新数据序列作为后继流计算操作的输入,这些数据序列就是流,多个流计算操作通过流连接在一起就构成了流程序。现有的或正在研发的流编程模型有很多,包括StreamC/KernelC[17,18],Brook,StreamIt,计算统一设备架构[19](ComputeUnifiedDeviceArchitecture,CUDA)和块同步GPU编程[20](BulkSynchronousGPUProgramming,BSGP)等。StreamC/KernelC流编程模型是由Stanford大学的系统实验室为其设计的流处理器Imagine开发的并行编程系统。Imagine集成了一个含有8个计算簇的处理器核,每个计算簇包含了8个功能单元在微控制器的管理下以SIMD的方式执行,一个流控制器接口接收来自主处理器发射的Imagine代码,一个128KB的流寄存器文件(StreamRegisterFile,SRF)用于存放计算数据的缓存,一个流内存负责主存与SRF间的数据传输[5]。程序代码分为两部分:一部分是在主处理器上执行的代码,用StreamC语言编写,另一部分
您可能关注的文档
- 非均匀磁场对量子点中电子能谱和磁化强度影响-influence of inhomogeneous magnetic field on electron energy spectrum and magnetization in quantum dot.docx
- 非均衡数据分类算法及其在助学贷款风险管理中的应用分析-classification algorithm of unbalanced data and its application analysis in risk management of student loans.docx
- 非均匀地基沉降对等距柱网框架的内力影响研究-study on the influence of non-uniform foundation settlement on internal force of equidistant column-net frame.docx
- 非均匀沟道dmos基本参数及其辐照理论的分析-analysis of the basic parameters of dmos with nonuniform channel and its irradiation theory.docx
- 非上市公司股权价值评估研究——以jh公司为例-research on stock right value evaluation of unlisted companies - taking jh company as an example.docx
- 非上市民营商业地产企业融资模式研究——以br集团为例-research on financing mode of unlisted private commercial real estate enterprises - taking br group as an example.docx
- 非审计服务对审计独立性影响探讨—以新大地为例-probe into the influence of non-audit services on audit independence - taking new land as an example.docx
- 非农化村庄社区发展策略分析-analysis on the development strategy of non-agricultural village community.docx
- 非受体酪氨酸激酶c-abl通过cdc25c调控g2m转换的机理研究-study on the mechanism of non-receptor tyrosine kinase c - abl regulating g2m conversion through cdc 25c.docx
- 非受体酪氨酸激酶c-abl调节微管组装的机理分析-mechanism analysis of non-receptor tyrosine kinase c - abl regulating microtubule assembly.docx
- 湖南省衡阳市第八中学2026届高三上学期第一次月考物理(原卷版).doc
- 浙江省普通高中尖峰联盟2026届高三上学期10月联考英语(原卷版).doc
- 四川省绵阳市南山中学实验学校2026届高三上学期10月月考英语(原卷版).doc
- 湖南省衡阳市第八中学2026届高三上学期第二次月考历史 Word版含解析.doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题09 功和机械能(原卷版).doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题10 内能及其利用(原卷版).doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题07 压强(原卷版).doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题01 机械运动(原卷版).doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题02 声现象(解析版).doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题02 声现象(原卷版).doc
原创力文档


文档评论(0)