- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据入门-详实步骤助力 it 经理充分利用 apache hadoop软件
2013 年2 月
规划指南
大数据入门
详实步骤助力IT 经理充分利用Apache Hadoop* 软件
为何阅读本文档
本规划指南为IT 经理提供了重要信息和实施步骤,以帮助他们对大数
据分析项目进行规划和实施,并着手开始使用Apache Hadoop* 软件。
指南具体内容包括:
• 大数据IT 环境,以及与这一颠覆性力量相关的挑战和机遇
• Hadoop* 软件介绍。Hadoop 是用于从大数据中挖掘重要洞察的新兴
标准,包括处理和分析工具 (Apache Hadoop MapReduce 和Apache
HBase* 软件)
• 有关如何充分利用Hadoop 软件的指南,重点介绍了英特尔能够在
哪些方面提供帮助,包括基础设施技术、优化和调试等
• 五个基础 “未来步骤”,以及一份核对清单,以帮助IT 经理高效规
划和实施Hadoop 项目
2013 年2 月
规划指南
大数据入门
详实步骤助力IT 经理充分利用Apache Hadoop* 软件
目录 3 大数据分析IT 环境
4 大数据分析揭秘
6 用于管理大数据的新兴技术
13 在您的数据中心内部署Hadoop
18 五大步骤及核对清单:
开始您的大数据分析项目
20 来自英特尔的更多资源
2 英特尔IT 中心 规划指南| 大数据
大数据分析IT 环境
有关大数据分析的讨论正在愈演愈烈。 大数据分析是IT 部门面临的一项严峻挑战—根据英特尔对200
名IT 经理所进行的调查,84% 的IT 经理已经在对非结构化数
如今,全球所有企业均需要应对前所未有的数据增长这一挑
据进行分析,而在还没有进行这项工作的IT 经理中,预计有
战。设想一下:截至到20 12 年末,数据世界中的数字容量将 5
44% 将在20 14 年以前开始实施。 大数据的潜在优势是非常
扩展到2.72 泽字节 (ZB )。这一数量预计每隔两年将会翻一
显著的。
番,到20 15 年将会达到8 ZB 数据。1 如此庞大的信息量很难
让人产生一个直观知识,但我们可以通过以下方式让您有一个 3V 不仅定义了什么是大数据,同时也指出了IT 需要解决的几
大致的概念:美国国会图书馆拥有462 万亿字节 (TB )的数 大重要问题:
2 这着实是一个
据,8 ZB 则相当于近1,800 万个国会图书馆,
• 容量。非结构化数据的庞大规模和增长步伐超过了传统存储
非常庞大的数据量。
和分析解决方案的能力范畴。
大数据的价值 • 多样性。传统的数据管理流程无法应对大数据—或 “影子
那么,什么是 “大
文档评论(0)