- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据分析与可视化技术应用实战
一、培训重点
1.数据分析实战
2.数据挖掘理论及核心技术
3.大数据算法原理及案例实现
4.Python应用实战
二、培训特色
1.理论与实践相结合、案例分析与行业应用穿插进行;
2.专家精彩内容解析、学员专题讨论、分组研究;
3.通过全面知识理解、专题技能和实践结合的授课方式。
三、日程安排
时间知识模块授课内容
第一讲零基础学Python
讲解Python背景、国内发展状况、基础语法、数据结构及绘
图操作等内容。特别针对向量计算这块,着重介绍Python在这方
面的优势及用法。
第二讲数据分析方法论
讲解统计分析基础,包括统计学基本概念,假设检验,置信区
第一天间等基础,并结合数据案例说明其使用场景和运用方法。介绍数据
数据分析实战
上午分析流程和常见分析思路,并结合案例进行讲解。
第三讲数据处理技法
从数据接入、数据统计、数据转换等几个方面进行讲解。数据
接入包含接入MySQL、Oracle、Hadoop等常见数据库操作;数据统
计包含Pandas包的具体用法和讲解;数据转换包含对数据集的关
联、合并、重塑等操作。此外,针对海量数据的情况下,介绍在
Spark平台上的数据处理技术,并结合真实环境进行操作讲解。
第四讲认识数据挖掘
讲解数据挖掘基本概念,细致讲解业务理解、数据理解、数据
准备、建立模型、模型评估、模型部署各环节的工作内容及相关技
术;结合业界经典场景,讲解数据挖掘的实施流程和方法体系。
第一天数据挖掘理论第五讲数据挖掘核心技术
下午及核心技术细致讲解抽样、分区、样本平衡、特征选择、训练模型、评估
模型等数据挖掘核心技术原理,并结合案例讲解其具体实现和用
法。尤其针对样本平衡,重点讲解人工合成、代价敏感等算法;针
对特征选择,重点讲解特征选择的核心思路,并结合Python进行
案例演示。
第二天大数据算法原第六讲特征降维算法及Python实现
5/5
上午理及案例实现降维是大数据分析非常重要的算法,它可以在降低极少信息
(1)量的情况下,极大地缩小数据规模。主要讲解主成分、LDA以及t-
SNE原理,并结合案例进行Python实现。特别地,针对海量数据
情况下的应用场景,讲解实现思路和Python案例。
第七讲决策树算法及Python实现
决策树是非常经典的算法,一般常见于小数据的挖掘。由于
决策树具有极强的可解释性,针对海量数据仍然是非常重要的实用
文档评论(0)