- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
hadoop目录hadoop目录
Hadoop知识乐园
大数据青年的精神家园
Hadoop是2013年最热门的技术之一,通过北风网robby老师
深入浅出Hadoop实战开发、Hadoop应用开发实战 两套课程的学习,普通Java开发人员可以在最快的时间内提升工资超过15000.成为一位完全精通Hadoop应用开发的高端人才。
Hadoop是什么,为什么要学习Hadoop?
Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。 Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 依赖于社区服务器,因此它的成本比较低,任何人都可以使用。 Hadoop带有用Java 语言编写的框架,因此运行在 Linux 生产平台上是非常理想的。本课程的讲解是采用linux平台进行模拟讲解,完全基于真实场景进行模拟现实
亮点一:技术先进,经典应用
新的课程采用了全新平台:Oracle VirtualBox + CentOs + 最新的Hadoop 1.x稳定版本,提供了更稳定,安全的平台,更加贴近企业级应用的真实环境。课程完整,详细的介绍并实现了多个Hadoop经典应用:搜索引擎自动推荐,好友智能推荐,最短路径算法,PageRank。他们代表了当前最成功,应用范围最广的Hadoop应用案例,特别是PageRank,更是Google赖以发家的法宝,直到如今,仍然是Google搜索引擎最为重要的技术。通过这些案例,对于学习如何开发成功的Hadoop应用有极大的帮助。
亮点二:内容实用,全面深入
非Java的MapReduce应用是Hadoop重要内容之一,Streaming和Pipes是将现有应用移植到Hadoop平台的重要技术。另外,Hadoop提供了海量数据的处理方案,但是如何进行原始数据收集,Apache Flume给出了答案,新的Apache Flume的解决方案,更加简单,实用和高效。课程还详细介绍了如何借助Hadoop提供的工具,对集群中的节点进行有效的管理,这些都是一个Hadoop管理人员必备知识。
亮点三:讲师丰富的电信集团云平台运作经验
讲师robby拥有丰富的电信集团工作经验,目前负责云平台的各方面工作,并拥有多年的企业内部培训经验。讲课内容完全贴近企业需求,绝不纸上谈兵。
第1章节: (4课时)
搜索引擎自动推荐(4课时)
新平台搭建: 使用VirtualBox创建CentOs虚拟机,并使用RPM的方式安装和使用Hadoop
内存数据库Redis的安装和基本使用
搜索引擎自动推荐算法讲解
使用JqueryUI + Ajax + Redis搭建前后台框架
使用Map Reduce实现数据统计算法
定制Map Reduce输出,将数据直接写入Redis内存数据库
第2章节: (3课时)
好友智能推荐 (3课时)
应用背景和算法详细讲解
Web框架搭建Struts2 + Redis
使用Map Reduce结合Redis实现潜在好友查找算法
完整的应用逻辑实现:前台好友关注,后台潜在好友查找,再到前台潜在好友推荐
第3章节:(2课时)
Hadoop Streaming(2课时)
非Java的Map Reduce实现
如何使用脚本语言实现一个Map Reduce任务
如何使用C语言实现一个Map Reduce任务
第4章节: (1课时)
Hadoop Pipes (1课时)
基于Hadoop Pipes,使用C++实现Map Reduce任务
第5章节: (2课时)
Apache Flume基础 (2课时)
Apache Flume概述
Flume
您可能关注的文档
- GCC认证的技术标准及其特点.doc
- GIS在城市交通工程中的应用.doc
- GIS算法基础重点.doc
- GIS试卷-13测量-A卷.doc
- GIS理论与实践学习报告2.doc
- GMP学习阶段性考试题.doc
- GIS空间数据库的建立.doc
- GMP呼唤高素质的检查员队伍.doc
- GOJS2012112 江苏生态文明建设工程研究.doc
- GPRS、3G无线通信模块做公共自行车租赁项目方案.doc
- 2025年智慧酒店数据可视化效果改进分析报告.docx
- 工业互联网设备预测性维护2025年技术创新与设备维护智能化.docx
- 2025年风电设备故障诊断与预测性维护报告.docx
- 2025年海洋能发电与海岛生态保护产业融合发展报告.docx
- 山东省邹城第一中学2024-2025学年高三下学期3月月考语文试题试卷含解析.doc
- 聚焦2025:京东物流仓储自动化技术投资风险评估报告.docx
- 2026届高三语文课内文言文复习:《谏太宗十思疏》.pptx
- 2025年零售行业会员体系会员日促销与复购率提升策略.docx
- 跨境电商行业政策红利释放:2025年市场前景与未来十年行业趋势报告.docx
- 中山市重点中学2025届初三下学期第五次联考生物试题含解析.doc
文档评论(0)