hadoop高级编程构建与实现大数据解决方案.docVIP

  • 0
  • 0
  • 约4.91千字
  • 约 12页
  • 2020-09-10 发布于山东
  • 举报

hadoop高级编程构建与实现大数据解决方案.doc

hadoop 高级编程构建与实现大数据解决方 案 篇一: Hadoop:大数据解决方案的常胜将军 Hadoop:大数据解决方案的常胜将军 结构化数据、面向文档数据存储及大型处理。猜猜它是 什么。 关键词:大数据解决方案 Hadoop Hive Mahout HBase Cassandra 架构大数据解决方案的软件工程师们都知道,业务分析 有一项技术跨越了 SQL数据库、 NoSQL数据库,非结构化数 据、面向文档数据存储及大型处理。如果你猜到了 Hadoop, 那你回答正确。 Hadoop 也是许多巨头公司具有的一个共性,如亚马逊、 雅虎、 AOL、Netflix 、eBay、微软、谷歌、 Twitter 和 Facebook。IBM 甚至是走在时常的前沿,促进 Hadoop 进 行企业分析。此开源模型无处不在,它在这个舞台上停留的五年,是一个真的角色,我们不得不为此感到惊讶。 导读:架构大数据解决方案的软件工程师们都知道,业 务分析有一项技术跨越了 SQL数据库、 NoSQL数据库,非 Hadoop 的未来 为了了解过去几年发生了什么,我们走访了  Chuck Lam, 《Hadoop 在行动( Hadoop in Action )》一书的作者。 Chuck 说 Hadoop 还没有停下来休息。“整个生态系确实是进化, 而且改变了许多。现在甚至出现了官方版本。更重要的是, MapReduce 的基础编程模型已经重新修订,且做了不少的改变。”一般来说,这些改变都向着有利的方面发展的。开发方向已经使得这个框架易于部署在企业中,并解决一系列的问题,如对于风险规避公司是问题之首的安全问题。 好处越来越多,包括高水平的可扩展性。此框架中的分布式计算意味着添加越来越多的数据,而不必改变添加它的方式。没有必要去改变格式,或打乱工作编辑的方式或决定哪一个应用完成的此工作。你只是随着工作的进行添加更的节点即可。你不必挑剔你存储的数据类型或它。无模式是此游戏的名称。该框架的并行计算能力还使商品服务器存储究 竟的利用率更高。 这意味着企业可以保存, 使用更多的数据。无论哪个节点出现故障,它都没事。即使系统出现故障,也 不会丢失数据,降低性能。 助力 Hadoop 技术 Hadoop 现在也更加的灵活, 允许业务做更的事情, 处理 更多的数据类型。如此强大的功能源于 Hadoop 的许多同伴 项目,包括像 Pig 这样的语言, 以及如下的可扩展解决方案: 1. Hive 当然,此类型的解决方案并不一直都是美好好。 Lam 说 主要的陷阱就是处理做出的假设。换言之,错不在我们的系 统而在我们自己。“新技术并不是所有问题的灵丹妙药。正 如 NoSQL这类的一样简单,但你必须要更深一层地弄清楚你要解决的问题。”这可能意味着慎重地查看你的算法,而不 是只是把你的员工扔给 MapReduce,然后期望 Hadoop 自动扩 展。使用模式的数据会影响你的扩展模式——尤其是当使用 不平均是。然后线性扩展可能就不起作用了。再一次,这个 并不是 Hadoop 本身的问题。 Lam相信有工具在手的企业已经 足够成熟了。这只是确保 IT 管理员熟悉这些工具,确保使 用 Hadoop 的软件架构师知道怎样更有效地使用用这项技术。篇二:大数据技术之 hadoop 实战笔记 Hadoop 一直是我想学习的技术, 正巧最近项目组要做电 子商城,我就开始研究 Hadoop,虽然最后鉴定 Hadoop 不适用我们的项目,但是我会继续研究下去,技多不压身。 《 Hadoop 基础教程》是我读的第一本 Hadoop 书籍,当然在线只能试读第一章,不过对 Hadoop 历史、核心技术和应用场景有了初步了解。 Hadoop 历史 雏形开始于 20XX 年的 Apache 的 Nutch ,Nutch 是一个 开源 Java 实现的搜索引擎。它提供了我们运行自己的搜索 引擎所需的全部工具。 包括全文搜索和 Web爬虫。随后在 20XX 年 Google 发表了一篇技术学术论文谷歌文件系统( GFS)。 GFS也就是 google File System, google 公司为了存储海量搜索数据而设计的专用文件系统。 20XX年 Nutch 创始人 Doug Cutting 基于 Google 的 GFS论文实现了分布式文件存储系统名为 NDFS。 20XX年 Google 又发表了一篇技术学术论文 MapReduce。 MapReduce是一种编程模型,用于大规模数据集(大于 1TB) 的并行分析运算。 20XX 年 Doug Cutting 又基于 MapReduce,在 Nutch 搜索引擎实现了该功能。 20XX年,Yahoo 雇用了 Doug Cutting , D

文档评论(0)

1亿VIP精品文档

相关文档