大数据环境下并行计算模型的研究进展.pptxVIP

大数据环境下并行计算模型的研究进展.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

作为高性能计算和超级计算的核心技术,并行计算是充分利用资源加速计算的主要途径.

并行程序设计始终没有成为主流程序设计的核心,设计和开发并行程序的必要性和紧迫性被无意的掩盖:编程门槛极高、并行控制逻辑编写难度大、遵循摩尔定律的影响

大数据时代的来临,人们对应用需求、硬件环境、互联模式到计算技术都在发生显著的变化,分布式并行计算的需求也在日益突出

多样化的并行计算模型是消除分布式并行应用开发瓶颈、推动大数据发展的核心技术之一.;并行计算的回顾

并行计算模型

结论与展望;并行计算是突破串行计算效率瓶颈、提高计算性能的有力和必须的手段.

并行计算:

由流水线技术为代表的时间并行

以多处理器并发执行为代表的空间并行;1954年,首台内建浮点硬件的商用机器IBM704,并行加速理念被随之带入。

1964年第一台在技术和市场上同时获得成功的高性能大规模并行计算机CDC6600研制成功.

1965年,分时操作系统Multics(宣告失败),但诞生了Unix系统和C语言.

1966年,Flynn分类法等对并行计算系统进行分类

大量数值并行算法和并行程序设计技术的出现也在有力推动着并行计算的发展和应用;在生物制药、气候预测、高精武器设计等科学计算领域获得了巨大的成功.

在非科学计算领域滞后

主要原因

摩尔定律(随着半导体技术的发展,单个处理器的性能以平均年50%的速度在不断提升,无发展动力)

分布式并行编程的门槛相对较高(不确定性和异步性)

并行计算的模式高度依赖于并行硬件环境和体系结构,但是并行硬件环境本身的构建也存在着成本高、可扩展性差、管理困难、能耗大等诸多问题。

;摩尔定律的影响力正在减弱,并行技术成为最大限度利用多/众核处理器能力的必须途径

云计算为分布式并行计算提供了新的平台(开放性,商业性)

大数据带来了迫切的应用需求(数据密集型科学研究,数据密集型计算)

;集群规模的可伸缩性和分布式并行应用的可编程性成为了主要的发展矛盾,而架构在硬件和应用之间的计算模型则成为缓解两者之间矛盾的最关键的技术之一。

计算模型是一种涵盖存储模型、执行模型、调度模型、恢复模型的综合抽象。

特点:可以有效屏蔽大量繁杂的并行控制细节,能够在大规模廉价集群中以并行、可扩展、容错、易用、透明的方式支持各种并行算法的高效执行,为开发人员提供简洁的编程抽象,极大降低大规模集群并行编程的门槛.;Dryad(Micros0ft)

MapReduce(Google)

谷歌公司的MapReduce是最早受到关注且应用最广泛的并行编程模型,并且随着其开源实现Hadoop的兴起,已经成为学术界和工业界事实上的海量数据并行批量处理的标准。

特性:线性可扩展性、高可用性、易用性、容错性、负载平衡以及鲁棒性。可伸

文档评论(0)

191****2971 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档