- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要过去几十年来,代表CPU性能的主频在不断的提高,但由于生产工艺、功耗以及架构设计等原因使得主频之路已经走到了尽头。在无法进一步提高处理器主频的情况下,CPU进入了多核时代。对于计算密集型的应用,由若干个完全相同处理器核心构成的同构多核CPU并不是最好的方案。因此,出现了以通用CPU加专用加速核心构成的异构计算平台,并且逐渐成为高性能计算领域的主流架构。这种底层硬件架构的革新也给在它上面的程序开发带来重大改变。而目前的异构多核平台都面临着性能调优困难和编程复杂的问题。如何简化编程,如何充分发挥异构多核平台的性能是程序开发方面不得不面临的挑战。在异构多核计算平台上,专用加速核心是提供计算能力的主要部件,如何挖掘加速核心的处理能力是影响整体性能的关键。本研究提出了基于异构多核平台的多粒度并行优化策略,基于该模型实现的应用能最大限度地使用专用加速核心硬件计算资源,由此,总结出在异构多核平台上的专用加速核心端进行性能调优的一般规律。现代异构计算平台的异构多核架构中,加速核心通常用于计算,但平台上的多核CPU的计算能力同样很强大。为了利用CPU的计算能力,针对数据并行应用,提出了异构数据并行模型,该异构数据并行模型通过对CPU和加速核心间负载的合理划分,使得CPU和专用计算核心间的负载达到均衡。在利用专用加速核心计算能力的同时,充分发挥多核CPU的计算能力,从而提高系统整体的性能。同样是为了利用多核CPU的计算性能,对于一些流式数据并行计算的应用,提出了流式计算模型,该模型是由CPU、加速核心以及它们之间的数据通信组成一条三阶段的流水线。CPU端对输入数据进行初步处理,过滤掉部分无需APU处理的数据,这样做一方面减少了CPU与加速核心之间的巨大的通信延迟;另一方面也降低专用加速核心的负载。通过调整CPU端的过滤的精度来协调CPU和专用加速核心之间的负载,使流水线处于充盈状态,以达到整体的性能最优。在异构多核计算平台中,由于CPU和加速核心在存储系统上具有不同的特点并具有各自独立的地址空间,导致CPU和加速核心之间的数据传输是消息驱动的传输方式。在进行应用开发时,CPU和加速核心之间数据传输需要程序员显式调用API来进行,增加了编程的复杂性,加重了程序员的负担。通过在NVIDIAGPU平台上基于CUDA编程环境设计并实现了memCUDA原型系统,memCUDA通过扩展CUDA的关键字,利用源到源的代码转换,实现了设备内存到主内存的映射,从而屏蔽掉数据传输和设备内存的操作,简化编程。同时,通过优化异步执行的方式,对符合条件的应用能达到提高性能的目的。关键词:异构多核处理器结构,编程模型,并行计算,CellBE,CUDA,性能评估AbstractOverthepastfewdecades,thefrequencyofCPUissustainedincreased,whichdominatetheperformanceofCPU.However,theapproachthatgetsperformanceimprovementthroughincreasingthefrequencyisnotavailableduetothemicrochipproductionprocess,power,CPUarchitecturedesignandsomeotherinevitablechallenges.TomaintaintheMoore’sLaw,thechipvendorsleadtheCPUtoentermulticoreera.Currently,therearetwokindsofarchitectureformulticoreCPU,homogeneousandheterogeneousmulticore.Forcomputing-intensiveapplications,thehomogeneousmulti-corewhichisconsistedofafewofidenticalCPUcoresisnotthemostappropriatesolustion.Oppositely,theheterogeneousmulticorearchitecturewhichisconsistedofCPUanddedicatedaccelerator-basedcorescouldachievebetterperformanceandisbecomingthemainstreamarchitectureofthehighperformancecomputingcommunity.Theinnovationofthehardwareintroducedthenewchallengesofprogrammingonit.Howtoboostu
您可能关注的文档
- 基于位置传感器的焊缝跟踪信号的检测与处理-机械工程专业论文.docx
- 基于移动Agent的信息检索系统的设计与实现-软件工程专业论文.docx
- 基于粘滑驱动的精密定位台建模与控制-机械电子工程专业论文.docx
- 基于双馈风力发电系统的微电网运行控制与分析-电工理论与新技术专业论文.docx
- 基于语义与视觉特征融合图像搜索引擎的研究与实现-信号与信息处理专业论文.docx
- 基于移动电话含权网络上的舆论扩散研究-软件工程专业论文.docx
- 基于小波变换的图像去噪算法-电子与通信工程专业论文.docx
- 基于运行模式的平面交叉口车辆排放研究-载运工具运用工程专业论文.docx
- 基于硬质合金的刀具钝化工艺分析与研究-机械设计及理论专业论文.docx
- 基于振动分析的刀具磨损状态与切削参数之间相关关系的试验研究-农业机械化专业论文.docx
- 基于双频调相的荧光传感系统的研究与实验分析-信息与通信工程专业论文.docx
- 基于图像内容检索的乳腺肿块诊断方法研究-计算机应用技术专业论文.docx
- 基于小波轮廓的图像语义标注研究-计算机软件与理论专业论文.docx
- 基于小波变换和模糊聚类的自适应水印嵌入方法-概率论与数理统计专业论文.docx
- 基于涨落耗散理论的电磁超材料近场热辐射特性-光学专业论文.docx
- 基于图像低层特征的领带花型检索研究-信号与信息处理专业论文.docx
- 基于战略地图的高职院校绩效管理分析-管理科学与工程专业论文.docx
- 基于图像处理和模式分类的茶叶杂质识别研究-机械设计及理论专业论文.docx
- 基于线阵CCD相机的轨道图像采集系统设计-精密仪器及机械专业论文.docx
- 基于约束的多视图集成学习方法研究-计算机应用技术专业论文.docx
文档评论(0)