大数据云计算系统高级架构师课程学习路线图.docxVIP

大数据云计算系统高级架构师课程学习路线图.docx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据云计算系统高级架构师课程学习路线图

大数据、云计算系统高级架构师课程学习路线图大数据之Linux+大数据开发篇Java?Linux基础?Shell编程?Hadoop2.x?HDFS?YARN?MapReduce?ETL数据清洗Hive?Sqoop?Flume/Oozieo?大数据WEB工具Hue?HBase?Storm?Storm?ScalaSpark?Spark核心源码剖析?CM 5.3.x管理?CDH 5.3.x集群项目部分项目一:北风网用户行为分析?项目二:驴妈妈离线电商平台分析平台?项目三:基于Spark技术实现的大型离线电商数据分析平台大数据之阿里云企业级认证篇阿里云数据处理和分析?报表场景的实现(企业案例)?企业自助沙箱实验(10个)?阿里云企业认证(ACP11003模块)大数据之Java企业级核心技术篇Java性能调优?Tomcat、Apache集群?数据库集群技术?分布式技术?WebLogic企业级技术大数据之PB级别网站性能优化篇CDN镜像技术?虚拟化云计算?共享存储?海量数据?队列缓存?Memcached+Redis\No-SqlLVS负载均?Nginx项目部分PB级通用电商网站性能优化解决方案大数据之数据挖掘\分析机器学习篇Lucene?爬虫技术?Solr集群?KI分词?Apriori算法?Tanagra工具?决策树?贝叶斯分类器人工神经网络?K均值算法?层次聚类?聚类算法?SPSS Modeler?R语言?数据分析模型统计算法?回归?聚类?数据降维?关联规则?决策树?Mahout-Python金融分析项目部分项目一:地震预警分析系统?项目二:文本挖掘(Mathout\中文分词)?项目三:电商购物车功能实现(R语言)项目四:使用Python构建期权分析系统大数据之运维、云计算平台篇Zookeeper?Docker?OpenStack云计算项目部分项目部分:Maven+Jenkins、日志管理ELK、WordPress博客了解更多详情课程体系北风大数据、云计算系统架构师高级课程阶段一、大数据、云计算 - Hadoop大数据开发技术课程一、大数据运维之Linux基础本部分是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,openstack等众多课程。因为企业中的项目基本上都是使用Linux环境下搭建或部署的。1)Linux系统概述2)系统安装及相关配置3)Linux网络基础4)OpenSSH实现网络安全连接5)vi文本编辑器6)用户和用户组管理7)磁盘管理8)Linux文件和目录管理9)Linux终端常用命令10)linux系统监测与维护课程二、大数据开发核心技术 - Hadoop 2.x从入门到精通本课程是整套大数据课程的基石:其一,分布式文件系统HDFS用于存储海量数据,无论是Hive、HBase或者Spark数据存储在其上面;其二是分布式资源管理框架YARN,是Hadoop 云操作系统(也称数据系统),管理集群资源和分布式数据处理框架MapReduce、Spark应用的资源调度与监控;分布式并行计算框架MapReduce目前是海量数据并行处理的一个最常用的框架。Hadoop 2.x的编译、环境搭建、HDFS Shell使用,YARN 集群资源管理与任务监控,MapReduce编程,分布式集群的部署管理(包括高可用性HA)必须要掌握的。一、初识Hadoop 2.x1)大数据应用发展、前景2)Hadoop 2.x概述及生态系统3)Hadoop 2.x环境搭建与测试二、深入Hadoop 2.x1)HDFS文件系统的架构、功能、设计2)HDFS Java API使用3)YARN 架构、集群管理、应用监控4)MapReduce编程模型、Shuffle过程、编程调优三、高级Hadoop 2.x1)分布式部署Hadoop 2.x2)分布式协作服务框架Zookeeper3)HDFS HA架构、配置、测试4)HDFS 2.x中高级特性5)YARN HA架构、配置6)Hadoop 主要发行版本(CDH、HDP、Apache)四、实战应用1)以【北风网用户浏览日志】数据进行实际的分析 2)原数据采集 3)数据的预处理(ETL) 4)数据的分析处理(MapReduce)课程三、大数据开发核心技术 - 大数据仓库Hive精讲hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。一、Hive 初识入门1)Hive功能、体系

文档评论(0)

jiulama + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档