- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多核处理器的常见计算任务分析与优化
基于多核处理器的常见计算任务分析与优化摘要本文介绍了三种常见计算任务中针对多核处理器的性能分析与优化设计的新技术,这三种常见计算任务分别是:广泛用于组合搜索与优化的动态规划算法(DP, Dynamic Programming),广泛用于科学计算的矩阵计算,以及集群(Cluster)这样传统的并行计算技术。针对动态规划算法,从其一般形式入手,介绍非连续多元动态规划算法在多核处理器环境下的一系列优化技术;针对矩阵计算,介绍针对多核处理器环境的乱序调度算法;针对多核集群,分析了多核处理器对传统集群技术带来的性能,特别是通信性能上的影响。关键词:多核、动态规划、集群、矩阵计算1 引言人们追求计算能力的脚步从没有放缓,过去数十年的发展证明了摩尔定律——微处理器的性能将以指数方式增长,即每两年翻一番。但是目前的技术已经难以通过提高频率来维持这种增长速度,一个主要的问题就是过度产热(overheat)问题,以及能耗问题。因此,多核处理器设计应运而生,即在同一块芯片上放置两个甚至更多处理核心,通过将应用程序的工作复杂分担到不同的核心来提高应用程序性能。这种处理器也被称为片内多处理器(CMP, Chip Multiprocessor)。本文2至4章将介绍多核处理器对三种常见计算任务的性能影响与相应计算任务的优化设计。这三种计算任务分别是广泛用于组合搜索与优化的动态规划算法(DP, Dynamic Programming),广泛用于科学计算的矩阵计算,以及集群(Cluster)这样传统的并行计算技术。针对动态规划算法,从其一般形式入手,介绍非连续多元动态规划算法在多核处理器环境下的一系列优化技术;针对矩阵计算,介绍针对多核处理器环境的乱序调度算法;针对多核集群,分析了多核处理器对传统集群技术带来的性能,特别是通信性能上的影响。2 动态规划算法的分析与优化2.1 动态规划算法简介动态规划算法(Dynamic Programming, DP)是一种经典的,且为人熟知的算法,用于解决各种组合搜索与优化问题,广泛应用于任务调度、资源管理、自动控制、VLSI设计与生物医学等应用中。动态规划算法的核心是动态规划方程(组),根据方程组,如果每一个子问题的解D[i]只依赖于与其直接相邻的子问题的解,则称其为连续的(Serial),否则,若D[i]依赖于多个非直接相邻的子问题的解,则称其为非连续的(Non-serial);如果D[i]的函数式中只包含一个递归项,即形如D[i]=Max0jif(D[j]),则称其为一元的(Monadic),否则,若包含多于一个递归项的,则称其为多元的(Polyadic)。由此,我们可以对动态规划算法做出一下分类[2]:一元连续动态规划算法(serial monadic),如单求解源最短路问题的Dijkstra算法、0/1背包问题;多元连续动态规划算法(serial polyadic),如求解全部点对之间最短路的Floyd;一元非连续动态规划算法(nonserial monadic),如最长公共子序列问题、寻找序列最优相似比较的Smith-Waterman;多元非连续动态规划算法(nonserial polyadic),如最优矩阵添括号问题、RNA二级结构预测所使用的Zuker算法。在这种分类方法中,多元非连续动态规划算法最具有可并行性,一元非连续动态规划和多元连续动态规划算法次之,一元连续动态规划算法几乎不具备可并行计算的部分。对于一元连续动态规划算法,我们只能依靠处理器内部实现的动态调度算法来实现简单的指令级并行,而对于多元非连续动态规划算法,则可以充分利用多核处理器的特性来提高其性能,2.2-2.6中将介绍多元非连续动态规划算法在多核处理器上的一种优化方法。2.2 动态规划方程(组)Zuker是非连续多元动态规划算法的一个典型例子,它是预测RNA二级结构的基对最大化算法。对给定的RNA序列,令S(i, j)表示自索引i至j的RNA子序列折叠结果,其数值表示折叠后的最高基对数量或者是最小自由能。其对应的动态规划方程组如下:(2.1)在这个方程组中,最后一个求最大值的等式就是一个非连续多元动态规划计算过程。这个方程组所描述的子问题间依赖关系如图2.1所示。图2.1 Zuker算法中子问题计算依赖关系为了方便进行一般性描述,可以将非连续动态规划的动态规划方程组做写作等式2.2的样子:(2.2)为了便于之后的描述,将这里的设定为1,则等式变为:(2.3)2.3 核外并行算法多核处理器继承了传统通用计算机的存储器结构,处理器核心直接访问独立的一级缓存,同一芯片上的处理器核心之间共享二级缓存,二级缓存之外是内存以及外部存储。相邻两级存储之间的速度相差了几乎一个数量级,因此,低速存储设备的访问速度可能造成并行处理的瓶颈,即数据传输无法满足并行
您可能关注的文档
- 土木工程概预算课件——第6章 公路工程概(预)算.ppt
- 土木工程概论3-评标和政府投资项目管理.ppt
- 土木工程(矿井建设方向)毕业实习大纲.doc
- 土木工程材料 第11章 合成高分子材料.ppt
- 土木工程钢筋连接技术10.ppt
- 圣唐胰岛素泵介绍.ppt
- 土石方机械操作工(中级)理论知识试卷( A ).doc
- 圣诞主题模板简约风格经典商务模板_05.pptx
- 在交叉和融合中发展的生物力学.doc
- 圣象生产工艺流程(新).ppt
- 2025《浅析数控车床的电动刀架故障诊断维修》8700字.docx
- 2025《农产品机器视觉检测系统中产品外观品质检测识别过程案例分析》5900字.docx
- 2025《太阳能电池板自动追踪系统设计》10000字.doc
- 2025《王老吉企业价值评估实证分析》13000字.doc
- 2025《建筑边坡工程及其应用研究》13000字.docx
- 2025《网络直播平台的发展现状与盈利模式分析—以虎牙直播为例》7000字.doc
- 2025《基于单片机的步进电机控制与显示系统设计》11000字.docx
- 2025《土木工程中高分子材料的发展应用研究》8000字.docx
- 2025《文冠果根腐病病原鉴定及根腐病防控药剂筛选研究》9400字.doc
- 2025《内窥镜的结构与使用管理现状分析》5000字.docx
最近下载
- 华医网2025继续教育《心力衰竭的规范化管理》习题答案.pdf VIP
- 南瑞集团招聘测评题及答案.pdf
- 03J103-2~7 建筑幕墙-标准图集.docx
- 25春国开_02154_数据库应用技术_机考资料.doc
- 2025第三季度作风建设党课以忠诚廉洁担当的政治品格奋力书写高质量发展新答卷.pptx VIP
- 钢筋混凝土化粪池22S702.docx VIP
- 铜陵学院2021-2022学年度《微观经济学》期末考试试卷含标准答案.docx
- 【课件3】流程责任人的角色认知.pptx VIP
- 人教版四年级数学上册期末测试卷(共三套)【有答案】.pdf
- 2025年医学影像技术考试卷及答案.docx VIP
原创力文档


文档评论(0)