外文翻译-副本探讨.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
毕业设计(论文)外文资料翻译 学 院: 计算机工程学院 专业班级: 计算机科学与技术 软件122 学生姓名: 李宝珠 学 号: 2012122737 指导教师: 单建魁(讲师) 外文出处: J. Parallel Distrib. Comput. 74 (2014) 2561–2573 附 件: 1.外文资料翻译译文 指导教师评语: 签名: 年 月 日 大数据分析的趋势 亮点 大数据分析中的当前的最先进技术的概述。 大数据分析的规模和应用前景趋势。 在硬件上的现况和未来的发展趋势,如何帮助我们解决大规模数据集。 讨论目前采用的软件技术和未来趋势,以解决大数据分析应用。 关键词: 大数据 分析 数据中心 分布式系统 摘要: 大数据分析是并行的分布式系统未来的主要应用之一。数据仓库目前应用的规模已经超过EB级,并且其规模还在不断增长。当数据集和相关应用程序超出了他们的规模,给这些的构成要求和软件开发方法的考虑带来了重大挑战。数据集通常是分布式,它们的大小和安全考虑到分布式技术来得到Bit Torrent允许节点共享多媒体数据内容通常直接彼此以分散的方式。这这些框架强调互操作性和动态性,降低成本,资源共享特定的沟通和协作,聚集。然而,在这些平台上,匿名,隐私问题和扩展性问题的考虑是次要的。 最近,云计算环境的可靠性、服务的健壮性被 (通常的访问来自客户机的浏览器)来自于客户端,大规模生产的移动设备和通用计算机的访问检验。云计算的服务观念概述为“基础架构即服务”(云计算资源在云中可用),数据即服务(数据在云中可用)和软件即服务(访问程序在云中执行)。从服务提供者的角度来看这提供了相当大的好处(在硬件和管理的成本降低),整体资源的利用率,以及更好的客户端接口。云环境的计算底层通常依赖于高效和弹性的数据中心架构,基于虚拟化的计算和存储技术,高效利用商品硬件组件。目前的数据中心通常规模为成千上万的节点,计算在云计算中经常跨越多个数据节点。 新兴的基于云的环境与分布式数据中心托管的大型数据仓库,同时也为分析提供强力的处理有效的并行/分布式算法的需要。潜在的社会经济效益的大数据分析,与多样性的应用提出是很大的挑战,在本文的其他部分我们重点强调数据分析问题的规模和范围。我们描述了常用的硬件平台上执行分析应用的相关情况,并考虑存储,处理,网络和能量。然后,我们专注于应用程序,即虚拟化技术,运行时系统/执行环境和编程的软件基础模型。我们在多样性数据分析的应用中,对健康和人类福利进行计算机建模与模拟得出一个简短的结论。 1.1数据分析的规模和范围 最近保守的研究估计,在2008年世界上的企业服务器系统已经能处理了9.57 ×10^21字节的数据。这一数字预计将从这基础上每两年翻了一番。举一个例子,沃尔玛的服务器每过一个小时就要处理超过一百万客户交易,这些信息插入到数据库,存储超过2.5 PB的数据与167座国会图书馆的书籍数量相当。在欧洲核子研究中心的大型强子对撞机每年将产生大约15千兆字节的数据,足以填满超过170万个双层DVD。每天,Facebook产生近500 TB的用户日志数据和数百万 TB的图像数据。每分钟,在YouTube有100小时的视频被上传,有135000小时的视频被观看。每一秒,有超过28000个多媒体(MMS)消息被发送。在2012大约4600万的移动应用程序被下载了,每一个应用程序收集到更多的数据。推特的服务上有超过5亿5000万的活跃用户,他们每秒钟产生9100条推特。eBay系统每一天处理超过100 PB的数据。在其他领域,波音喷气发动机每运转30分钟能产生10 TB的操作信息。其中,如果每一天有25000的航班,仅仅数据传感器和机器生产的足迹信息的数据,在 这些例子只是惊鸿一瞥,来自不同数据源的生态系统的数据集在迅速扩张。结构化数据(例如,金融,电子医学记录,政府统计),半结构化数据(例如,文本,微博,电子邮件),非结构化(例如,音频和视频),和实时数据(如网络痕迹,一般的监测日志)。如果有组织和适当的分析的话,所有这些应用都有可能提供宝贵的见解。在当今广泛公认需要有效分析的大型数据集的应用程序。这些应用包括医疗保健分析(例如,个性化基因组学),业务流程优化,和社会网络为基础的建议。然

文档评论(0)

1112111 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档