大数据分析与可视化技术应用实战- .pdfVIP

大数据分析与可视化技术应用实战- .pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据分析与可视化技术应用实战

一、培训重点

1.数据分析实战

2.数据挖掘理论及核心技术

3.大数据算法原理及案例实现

4.Python应用实战

二、培训特色

1.理论与实践相结合、案例分析与行业应用穿插进行;

2.专家精彩内容解析、学员专题讨论、分组研究;

3.通过全面知识理解、专题技能和实践结合的授课方式。

三、日程安排

时间知识模块授课内容

第一讲零基础学Python

讲解Python背景、国内发展状况、基础语法、数据结构及绘

图操作等内容。特别针对向量计算这块,着重介绍Python在这方

面的优势及用法。

第二讲数据分析方法论

讲解统计分析基础,包括统计学基本概念,假设检验,置信区

第一天间等基础,并结合数据案例说明其使用场景和运用方法。介绍数据

数据分析实战

上午分析流程和常见分析思路,并结合案例进行讲解。

第三讲数据处理技法

从数据接入、数据统计、数据转换等几个方面进行讲解。数据

接入包含接入MySQL、Oracle、Hadoop等常见数据库操作;数据统

计包含Pandas包的具体用法和讲解;数据转换包含对数据集的关

联、合并、重塑等操作。此外,针对海量数据的情况下,介绍在

Spark平台上的数据处理技术,并结合真实环境进行操作讲解。

第四讲认识数据挖掘

讲解数据挖掘基本概念,细致讲解业务理解、数据理解、数据

准备、建立模型、模型评估、模型部署各环节的工作内容及相关技

术;结合业界经典场景,讲解数据挖掘的实施流程和方法体系。

第一天数据挖掘理论第五讲数据挖掘核心技术

下午及核心技术细致讲解抽样、分区、样本平衡、特征选择、训练模型、评估

模型等数据挖掘核心技术原理,并结合案例讲解其具体实现和用

法。尤其针对样本平衡,重点讲解人工合成、代价敏感等算法;针

对特征选择,重点讲解特征选择的核心思路,并结合Python进行

案例演示。

第二天大数据算法原第六讲特征降维算法及Python实现

5/5

上午理及案例实现降维是大数据分析非常重要的算法,它可以在降低极少信息

(1)量的情况下,极大地缩小数据规模。主要讲解主成分、LDA以及t-

SNE原理,并结合案例进行Python实现。特别地,针对海量数据

情况下的应用场景,讲解实现思路和Python案例。

第七讲决策树算法及Python实现

决策树是非常经典的算法,一般常见于小数据的挖掘。由于

决策树具有极强的可解释性,针对海量数据仍然是非常重要的实用

文档评论(0)

133****6290 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档