- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
...
...
大数据分析课程标准
一、课程定位
现在企业为了提升客人使用体验,提高业务效率,在大数据蓬勃发展的阶段里,
需要对现有业务系统进行转型升级;作为大数据核心部分,大数据研发工程师应用成为
有大量数据的企业必备人才,在数据处理,数据分析方面,大数据研发是不可或缺的技
能。
随着大数据应用的大量普及, 开源框架,比如 hadoop,spark 等,也得到长足发展。
本课程除了着力于统数据的收集和搭建,使得作为大数据的研发 / 分析带来基础设施,
让学员掌握,同时,对大数据的离线 / 实时处理和部分数据分析进行深度理解和把握。
通过本课程,掌握大数据平台并且对大数据分析的基本技能和方法,为将来在企业分析
大数据做决策打下基础。
二、课程性质与作用
课程性质 大数据分析课程。
课程作用
大数据分析是数据清洗过后使得数据产生价值的过程。在企业丰富应用场景中,通
过标准的大数据分析方法不能胜任的情况下, 就需要通过先验知识来验证大数据并找出
规律来达到业务目标。在实际工作中,掌握大数据研分析需要展示的数理统计分析的知
识,敏锐的数据观察力,和部分软件开发的知识,也需要比较扎实的计算机基础。本课
程大纲是完整的课程,实际培训课程中,会根据学员实际情况进行分组。通过本课程的
学习。
三、课程目标
课程教学以灵活运用分析方法为目标,以实际项目为中心,以合理知识结构分解为
手段,结合实际的应用场景,对大数据进行文本,图标等大数据进行分析和学习,主要
以实际操作让学员对相关知识点掌握,达到理论与实际结合,教学与企业融合的内容。
学员学成后,能够利用清洗后的数据,根据提供的先验知识,可以做出模型并能够预测
业务数据。课程内容始终围绕全面提升学生的理论和操作的熟练程度、规范化程度以及
职业素质三个方面展开。
(一)知识目标
理解大数据概念及应用场景,先导课程 Linux 的操作
掌握开发语言 R或 python
1 / 8
掌握大数据 HDFS、HBase、Hadoop集群搭建及数据批处理。
离线工具 ETL和hive 的安装及应用。
数据可视化的应用
真实
(二)能力目标
全局的眼光理解大数据,理解大数据的应用,并有总体的概念。
理解企业中实际生产环境的大数据搭建,收集,分析,应用的过程。
具备在实际应用场景中,能对数据处理流程,数据挖掘进行个性化处理。
四、课程设计
主要指课程设计的总体思路:
课程设计围绕大数据分析的基础和方法,考虑到实际企业生产环境中的应用场景,
课程中采用实际案例,从案例分析、启动、实施、验证各环节剖析讲解,与真实环境同
步。
先导知识 R语言 Hadoop
生态
大量案例
算法及模
型
课程案例选取:
以搭建支持 10GB的数据为目标, 在目标 3 机器上部署大数据仓库, 并能实际运行。
模拟手机 1GB的数据,能够通过 Hive 进行查询,为将来数据清洗和数据分析提供基础。
五、课程内容与要求
知识块 知识点 课程目标 课时 案例
2 / 8
先导知识
Linux 系统 Linux 基础 先导课程,以
Linux- 常用命令介 掌握 Linux 基本操
绍 作未基础,加上对
Linux-shell 的特 Linux 操作系统的
殊符号以及 VI 编译工
进程管理的知识,
具 为后续的部署打下
Linux- 高级指令
基础。主要能够熟
练编辑和配置 (系统管理、查询、作
Linux 下的系统文 业控制、进程管理和
Linux 三剑客)
件并能够查找文件
和文字 Linux- 环境变量、
初始化文件和定时服务
Linux-shell 脚本
及编程
Linux- 备份工具
Linux- 安全性
Linux- 网络互联
Linux- 软件的安装
和日志
大数据基础
大数据概论 大数据背景 能够高度概括大数
大数据基本概念 据系统的前世今
大数据案例 生,实际了解企业
里面使用的大数据
大数据技术
的场景
HDFS分布式文 HDFS简介 掌握 DFS架构,配
件系统 HDFS基本架构
置及日常管理
使用场景
核心设计
体系架构
命令行使用
3 / 8
JAVA接口
运行机制
IO 操作
Hodoop集群安 Linux 环境准备 理解 Hadoop生态,
装部署 按照 JDK
能够安装并验证
按照并配置 Hadoop Hadoop集群。并实
启动并验证 Hadoop
际操作在现有生态
增加组件的安装及
集群
调整方式
MapReduce计算 编程模型 Wor
框架 编程案例
dCount
应用编程开发 高级编
MP工作机制和
程
YARN
YARN平台简介
YARN结构
YARN资源调度
作业调度
数据库知识
Hbase分布式数 简介 理解和掌握 HBase
据库 的原理及操作,并
能对 HBase
您可能关注的文档
最近下载
- 公用设备工程师(暖通空调)《公共基础》考试(重点)题库200题(含答案解析).docx VIP
- 【中小学】高一上下册古老的声音原始狩猎图课件.pptx VIP
- 2025-2026学年高二化学上学期第一次月考卷1(全解全析).docx VIP
- (统编版2025新教材)语文二年级上册识字3 拍手歌 课件.pptx
- 3晕针晕血的应急预案及处理流程.pptx VIP
- 《消防安全标志设置要求》.pdf VIP
- 《骨髓增殖性肿瘤》课件 .ppt VIP
- 五年级劳动课《包饺子》课件.pptx VIP
- 雁塔区第二小学基础教育学校硬件设施建设三年规划.docx VIP
- 《Access数据库应用教程》教学大纲、授课计划.docx
文档评论(0)