面向数据密集型计算hadoop及其应用研究-中国大数据.pdfVIP

面向数据密集型计算hadoop及其应用研究-中国大数据.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2008年伞围高性能计算学术年会 面向数据密集型计算Hadoop及其应用研究 孙兆玉袁志平黄宇光 (江南计算技术研究所无锡214(183 摘要:当前的数据密集型计算需要处理PB级数 乐、文本等多媒体信息处理,数据规模都轻易达到 据集和GB级数据流,面临着大规模数据管理、复 杂计算环境管理、可扩展计算平台等方面的难题.. 1+作时每秒产生200GB的测量数据;沃尔玛全球 每天产生2.67亿笔交易记录数据密集型计算DIC Hadoop是一种易扩展的分布式计算架构,能将廉 Intensive (Data 价PC节点联合起来提供大型计算服务一其HDFS Computing)研究目标是解决大规 Reduce并行框架为模数掂集和数据流的计算问题,目前同内外各研究 提供大规模存储管理,其Map 用户提供容易使用的并行编程模式。本文研究 Hadoop架构并探讨在数据密集型计算中的应用.. 累了重要的知识基础。而孕育于开源项目的 关键词:数据密集型计算分布式计算HadoopHadoop提供了一种扩展性和效率更为优秀的分布 HDFS 式计算半台,吸引了业界众多/J量(Yahoo!尤为 Map—Reduce备份任务 突m)投入,汲取了各种先进算法思想(如:GFS…】、 The of onthe ApplicationHadoop Map—Reduce”】等),使其在系统架构、计算效率、 Data-Intensive Computing 通用性方面表现m一定优势”“。 SUNZhao‘。YuYUAN HUANG Zhi‘。Ping Yu—Guang 2 DlC关键问题 Instituteof (Jiangnan ComputingTechnologWuxi, 214083) 数据密集型计算DIC主要包括科学计算、智能 isa kindofscalabledistributed信息处理,它对目前硬件、软件环境和算法设计提 Abstract:Hadoop architecturewhichcancombinea lotof 出了下述挑战:1)大规模数据存储、管理和传输。 computing PCsto It’s DIC的海量数据包括输入、中间步骤和结果”,既 inexpensiveprovidesupercomputing HDFS scale and 要保证数据安全,又必须兼顾应用设计从而减少计 providelarge storageMap—Reduce framework an 算中数据访问效率瓶颈;2)管理复杂计算环境。、 parallelcomputing prepareeasy modelforusers architecture programming Hadoop’s 在数据密集型计算系统环境里,不同厂商提供异种 andits onData—Intensivewill 架构的计算设备会同时存在;3)可扩展计算需求。 application Computing bediscussedinthis 数掂规

您可能关注的文档

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档