- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
串行算法并行化
西南大学第三届大学生数学建模竞赛
承 诺 书
我们仔细阅读了西南大学第三届大学生数学建模竞赛的竞赛规则.
我们完全明白,虽然本次竞赛采取分散自行答卷的机制,但在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
我们的参赛报名号为: 题目:串行算法并行化
参赛队员 (签名)
队员1:陈艳青
队员2:税萍
队员3:孙伟霞
日期:2009-5-3
串行算法并行化
摘 要
本文针对cpu串行算法并行处理的高效率性问题,建立了一个简单的数学模型,即n*n矩阵的乘法。通过串行算法和并行算法时间复杂度的比较,串行算法的时间复杂度为O (n^3),而并行算法的时间复杂度为2logn-1+log(n/logn),在n比较大时近似为O(logn),阐述了串行的并行化处理算法的高效性,并进入深入地分析,得到串行算法并行化的方法。
1、问题重述
从20世纪40年代开始的现代计算机发展历程可以分为两个明显的发展时代:串行计算时代、并行计算时代。由于实际应用对高性能、低价格和持续生产力日益增长的要求,并行处理技术已经成为现代计算机科研与发展的关键技术。并行计算,是将一个计算任务分摊到多个处理器上并同时运行的计算方法,双核CPU从外部看起来是一个CPU,但是内部有两个运算核心,它们可以独立进行计算工作。在同时处理多个任务的时候,多核处理器可以自然地将不同的任务分配给不同的核心。但只运行一个以常规的串行代码写成的程序时,如何将计算任务拆分成多个部分并分解到多个核心上同时运行,是我们要考虑的问题。由于并不是所有的程序都是易并行的,所以我们需要解决的问题是:
设计一种方法,能将一个常规的串行程序分解成两个部分,使之能够在CPU的两个核心上并行运算,并且尽量使双核的运算力被充分的利用起来;
假设算法使用C语言写成,代码里只有顺序执行、分支、循环三种结构;
假设只对整形变量和整形数组进行操作,不需要调用已有的库函数
程序中所有的语句只包括简单的代数运算、赋值、条件分支语句、循环语句,不包括其他语句。
2、问题分析
此问题要求对现成的串行算法进行并行化处理,代码里只涉及顺序、分支、循环三种结构,所以我们只需要建立一个简单的C程序算法,将能够使用双核心并行处理的部分分解开,使之在cpu的两个乃至多个核心上并行运算,其中关键是如何通过分析简单的代码,从总的计算任务中尽量识别可独立运算的部分,并估计每部分的计算量从而达到合理的把任务分配到各个处理器上。最大的一个问题就是模型求解,考虑一些改进的近似算法求解是得到结果的关键。
3、模型建立、求解及结果分析
为了具体说明串行算法的并行化处理,就以”n*n”矩阵的乘法为例建立模型:
常规算法的时间复杂度为O()。但是如果在一台处理机数为n^3/logn的PRAM上,用O(logn)时间就可以完成两个n*n矩阵的乘法。
设A和B为输入矩阵,假定最初可用的PE数为n^3个,后来降为n^3/logn个。
假设内存由三维阵列组成,将A、B存入其中两个平面。
假设了PE的三维地址指标。PE(i,j,k),0≤k≤n-1可用来计算输出矩阵的第(i,j)项,0≤i,j≤n-1,n是2的幂。
第一步,对应于每个输出的n乘积项用n个PE在O(1)时间内进行计算。
第二步,这些乘积项用O(logn)时间相加产生一个输出。所用的PE总数为n^3,结果存在C(i,j,0)中(0≤i,j≤n-1)。
假定这里的PRAM采用的是CREW策略。
Step 1:
1.Read A(i,k)
2.Read B(k,j)
3.Compute A(i,k)×B(k,j)
4.Store in C(I,j,k)
Step 2:
1.L←n
2.Repeat L←L/2
If (k1)then
begin
Read A(i,k)
Read A(i,k)
Compute C(i,j,k)+C(i,j,k,k+l)
Store in C(i,j,k)
End
Until (l=1)
上述是每个PE(i,j,k)要执行的程序。所有n^3个PE对n^3乘法进行并行运算。但对完成(n^3- n^2 )加法最多只有n^3/2个PE处于工
您可能关注的文档
最近下载
- 《控制图+第3部分:验收控制图GBT+17989.3-2020》详细解读.pdf
- 优秀教师评分细则(3篇).pdf VIP
- 《光电信息综合实验》课程教学大纲.doc VIP
- 《微积分》教案 1.4 两个重要极限.pdf VIP
- 《半导体封装技术》课程教学大纲(模板).docx VIP
- 思维训练与学习力提升-01-学习力的内涵与要素.pdf VIP
- UM-20200609-SIA-3000(COD)化学需氧量在线分析仪用户手册-1.10.pdf VIP
- UM-20200605-SIA-3000(NH3)氨氮水质在线分析仪用户手册-1.10.pdf VIP
- 水库大坝安全监测和管理特点研究.doc VIP
- 项目管理入门教程项目管理入门教程.ppt VIP
文档评论(0)