- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
外文翻译-副本课件
毕业设计(论文)外文资料翻译
学 院: 计算机工程学院 专业班级: 计算机科学与技术 软件122 学生姓名: 李宝珠 学 号: 2012122737 指导教师: 单建魁(讲师) 外文出处: J. Parallel Distrib. Comput. 74 (2014) 2561–2573 附 件: 1.外文资料翻译译文
指导教师评语:
签名:
年 月 日 大数据分析的趋势
亮点
大数据分析中的当前的最先进技术的概述。
大数据分析的规模和应用前景趋势。
在硬件上的现况和未来的发展趋势,如何帮助我们解决大规模数据集。
讨论目前采用的软件技术和未来趋势,以解决大数据分析应用。
关键词:
大数据 分析 数据中心 分布式系统
摘要:
大数据分析是并行的分布式系统未来的主要应用之一。数据仓库目前应用的规模已经超过EB级,并且其规模还在不断增长。当数据集和相关应用程序超出了他们的规模,给这些的构成要求和软件开发方法的考虑带来了重大挑战。数据集通常是分布式,它们的大小和安全考虑到分布式技术来得到Bit Torrent允许节点共享多媒体数据内容通常直接彼此以分散的方式。这这些框架强调互操作性和动态性,降低成本,资源共享特定的沟通和协作,聚集。然而,在这些平台上,匿名,隐私问题和扩展性问题的考虑是次要的。
最近,云计算环境的可靠性、服务的健壮性被 (通常的访问来自客户机的浏览器)来自于客户端,大规模生产的移动设备和通用计算机的访问检验。云计算的服务观念概述为“基础架构即服务”(云计算资源在云中可用),数据即服务(数据在云中可用)和软件即服务(访问程序在云中执行)。从服务提供者的角度来看这提供了相当大的好处(在硬件和管理的成本降低),整体资源的利用率,以及更好的客户端接口。云环境的计算底层通常依赖于高效和弹性的数据中心架构,基于虚拟化的计算和存储技术,高效利用商品硬件组件。目前的数据中心通常规模为成千上万的节点,计算在云计算中经常跨越多个数据节点。
新兴的基于云的环境与分布式数据中心托管的大型数据仓库,同时也为分析提供强力的处理有效的并行/分布式算法的需要。潜在的社会经济效益的大数据分析,与多样性的应用提出是很大的挑战,在本文的其他部分我们重点强调数据分析问题的规模和范围。我们描述了常用的硬件平台上执行分析应用的相关情况,并考虑存储,处理,网络和能量。然后,我们专注于应用程序,即虚拟化技术,运行时系统/执行环境和编程的软件基础模型。我们在多样性数据分析的应用中,对健康和人类福利进行计算机建模与模拟得出一个简短的结论。
1.1数据分析的规模和范围
最近保守的研究估计,在2008年世界上的企业服务器系统已经能处理了9.57 ×10^21字节的数据。这一数字预计将从这基础上每两年翻了一番。举一个例子,沃尔玛的服务器每过一个小时就要处理超过一百万客户交易,这些信息插入到数据库,存储超过2.5 PB的数据与167座国会图书馆的书籍数量相当。在欧洲核子研究中心的大型强子对撞机每年将产生大约15千兆字节的数据,足以填满超过170万个双层DVD。每天,Facebook产生近500 TB的用户日志数据和数百万 TB的图像数据。每分钟,在YouTube有100小时的视频被上传,有135000小时的视频被观看。每一秒,有超过28000个多媒体(MMS)消息被发送。在2012大约4600万的移动应用程序被下载了,每一个应用程序收集到更多的数据。推特的服务上有超过5亿5000万的活跃用户,他们每秒钟产生9100条推特。eBay系统每一天处理超过100 PB的数据。在其他领域,波音喷气发动机每运转30分钟能产生10 TB的操作信息。其中,如果每一天有25000的航班,仅仅数据传感器和机器生产的足迹信息的数据,在
这些例子只是惊鸿一瞥,来自不同数据源的生态系统的数据集在迅速扩张。结构化数据(例如,金融,电子医学记录,政府统计),半结构化数据(例如,文本,微博,电子邮件),非结构化(例如,音频和视频),和实时数据(如网络痕迹,一般的监测日志)。如果有组织和适当的分析的话,所有这些应用都有可能提供宝贵的见解。在当今广泛公认需要有效分析的大型数据集的应用程序。这些应用包括医疗保健分析(例如,个性化基因组学),业务流程优化,和社会网络为基础的建议。然而,预测表明数据增长将在
您可能关注的文档
- 嵌入式个人报告.docx
- 山科大结构力学04-09、12试题课案.doc
- 山河水环境整治1标5景点独立施工方案课案.doc
- 嵌入式复习要点-精简版课案.doc
- 嵌入式复习资料.doc
- 嵌入式操作系统应用开,UNIXLINUX程序设计.doc
- 崔秉琦高清数字电视打印版课案.doc
- 嵌入式软件练习课案.doc
- 岩土工程认识实习报告课案.doc
- 嵌入式驱动技术实训指导书课案.doc
- 农村集体经营性建设用地入市的法律问题与规制研究毕业答辩汇报.pptx
- 微生物学微生物制剂在农业病虫害防治中的应用答辩汇报.pptx
- 融媒体语境下文学教育的转型与创新发展研究答辩汇报.pptx
- 服务业财务风险的日常管控——资金稳健与盈利稳定双保障实践毕业答辩.pptx
- 2026年保险学专业保险科技发展与行业升级答辩.pptx
- 双碳目标下绿色税收体系的构建与法律完善研究答辩汇报.pptx
- 县域农产品电商品牌建设与区域经济发展研究毕业论文答辩.pptx
- 现代书籍装帧设计中的非遗工艺应用与文化传承研究毕业论文答辩.pptx
- 2026年经济统计学专业课题实践与数据质量赋能答辩.pptx
- 2026年包装工程专业包装设计与环保应用研究答辩.pptx
最近下载
- T_BJWA 001-2021_健康直饮水水质标准.pdf VIP
- 2025年污水厂技术交底.pdf VIP
- IPC-WHMA-A-620A 线缆及线束组件工艺要求与检验标准.pdf VIP
- 福建农林大学研究生学位论文格式的统一要求(2025年修订).docx VIP
- IPC-A-620培訓教材 培训资料.pdf VIP
- 统编版三年级语文上学期第七单元综合提优卷(B)(含答案).pdf VIP
- 《心理健康与职业生涯》电子教案.pdf VIP
- 肿瘤溶解综合征 (3)ppt课件.pptx VIP
- 高一英语动词的时态、语态和非谓语专项练习(含答案).docx VIP
- 安全生产工作会议记录范文6篇.pdf VIP
原创力文档


文档评论(0)