- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
外文翻译-副本报告
毕业设计(论文)外文资料翻译
学 院: 计算机工程学院 专业班级: 计算机科学与技术 软件122 学生姓名: 李宝珠 学 号: 2012122737 指导教师: 单建魁(讲师) 外文出处: J. Parallel Distrib. Comput. 74 (2014) 2561–2573 附 件: 1.外文资料翻译译文
指导教师评语:
签名:
年 月 日 大数据分析的趋势
亮点
大数据分析中的当前的最先进技术的概述。
大数据分析的规模和应用前景趋势。
在硬件上的现况和未来的发展趋势,如何帮助我们解决大规模数据集。
讨论目前采用的软件技术和未来趋势,以解决大数据分析应用。
关键词:
大数据 分析 数据中心 分布式系统
摘要:
大数据分析是并行的分布式系统未来的主要应用之一。数据仓库目前应用的规模已经超过EB级,并且其规模还在不断增长。当数据集和相关应用程序超出了他们的规模,给这些的构成要求和软件开发方法的考虑带来了重大挑战。数据集通常是分布式,它们的大小和安全考虑到分布式技术来得到保证。数据经常驻留在不同的平台上计算,对网络能力,容错性,安全性和访问控制的考虑是在许多应用中的关键。在其他应用程序中,分析任务的截止时间主要与数据质量有关。对于大多数新兴应用程序,数据驱动的模型和方法,能够大规模操作的方法,到目前还未找到。即使知道可以缩放的方法,验证结果又是一个重大的问题。硬件平台的特性和软件堆栈从根本上影响数据分析。在这篇文章中,我们提供了一个概述的最先进的硬件和软件的趋势在大数据分析应用程序前景的应用。
引言
随着互联网关键的技术的发展,计算作为一个实用程序的设想在上世纪90年代中期开始形成。在网格计算时代的早期人们通常认为硬件作为主要资源。网格计算技术专注于分享、选择和聚合各种各样的地理上分布的资源。这些资源包括超级计算机、存储和其他设备,用来解决在科学、工程和商业的大规模计算密集型问题。这些框架的一个关键特性是他们的支持透明跨域管理和资源管理能力。“数据即资源”的概念被普及在p2p系统。Napster、Gnutella,和Bit Torrent允许节点共享多媒体数据内容通常直接彼此以分散的方式。这这些框架强调互操作性和动态性,降低成本,资源共享特定的沟通和协作,聚集。然而,在这些平台上,匿名,隐私问题和扩展性问题的考虑是次要的。
最近,云计算环境的可靠性、服务的健壮性被 (通常的访问来自客户机的浏览器)来自于客户端,大规模生产的移动设备和通用计算机的访问检验。云计算的服务观念概述为“基础架构即服务”(云计算资源在云中可用),数据即服务(数据在云中可用)和软件即服务(访问程序在云中执行)。从服务提供者的角度来看这提供了相当大的好处(在硬件和管理的成本降低),整体资源的利用率,以及更好的客户端接口。云环境的计算底层通常依赖于高效和弹性的数据中心架构,基于虚拟化的计算和存储技术,高效利用商品硬件组件。目前的数据中心通常规模为成千上万的节点,计算在云计算中经常跨越多个数据节点。
新兴的基于云的环境与分布式数据中心托管的大型数据仓库,同时也为分析提供强力的处理有效的并行/分布式算法的需要。潜在的社会经济效益的大数据分析,与多样性的应用提出是很大的挑战,在本文的其他部分我们重点强调数据分析问题的规模和范围。我们描述了常用的硬件平台上执行分析应用的相关情况,并考虑存储,处理,网络和能量。然后,我们专注于应用程序,即虚拟化技术,运行时系统/执行环境和编程的软件基础模型。我们在多样性数据分析的应用中,对健康和人类福利进行计算机建模与模拟得出一个简短的结论。
1.1数据分析的规模和范围
最近保守的研究估计,在2008年世界上的企业服务器系统已经能处理了9.57 ×10^21字节的数据。这一数字预计将从这基础上每两年翻了一番。举一个例子,沃尔玛的服务器每过一个小时就要处理超过一百万客户交易,这些信息插入到数据库,存储超过2.5 PB的数据与167座国会图书馆的书籍数量相当。在欧洲核子研究中心的大型强子对撞机每年将产生大约15千兆字节的数据,足以填满超过170万个双层DVD。每天,Facebook产生近500 TB的用户日志数据和数百万 TB的图像数据。每分钟,在YouTube有100小时的视频被上传,有1350
文档评论(0)