大数据挖掘与分析教程.pdfVIP

  • 13
  • 0
  • 约1.61万字
  • 约 18页
  • 2025-06-17 发布于河北
  • 举报

大数据挖掘与分析教程

第1章大数据概述3

1.1大数据的发展历程3

1.2大数据的概念与特征4

1.3大数据的应用领域4

第2章数据预处理5

2.1数据清洗5

2.1.1除噪声5

2.1.2处理异常值5

2.1.3删除重复数据5

2.1.4处理缺失值5

2.2数据整合5

2.2.1数据集成6

2.2.2冗余数据处理6

2.2.3数据一致性处理6

2.3数据转换6

2.3.1数据离散化6

2.3.2数据分组6

2.3.3特征提取6

2.4数据归一化与标准化6

2.4.1数据归一化6

2.4.2数据标准化6

第3章数据仓库与OLAP技术7

3.1数据仓库的构建与设计7

3.1.1数据仓库的基本概念7

3.1.2数据仓库的架构7

3.1.3数据仓库的设计方法7

3.1.4数据仓库的建模7

3.2联机分析处理(OLAP)技术7

3.2.1OLAP的基本概念7

3.2.2OLAP的类型7

3.2.3OLAP操作8

3.3数据立方体的构建与操作8

3.3.1数据立方体的构建8

3.3.2数据立方体的操作8

3.4多维数据分析方法8

3.4.1聚合分析8

3.4.2数据切片与切块8

3.4.3数据钻取8

3.4.4数据旋转8

第4章数据挖掘算法8

4.1美联规则挖掘9

4.2聚类分析9

4.3分类与预测9

4.4时间序列分析9

第5章统计分析与数据挖掘9

5.1描述性统计分析9

5.2假设检验与置信区间9

5.3回归分析10

5.4主成分分析与因子分析10

第6章机器学习与深度学习10

6.1监督学习10

6.1.1线性回归10

6.1.2逻辑回归10

6.1.3支持向量机10

6.2无监督学习10

6.2.1聚类11

6.2.2降维11

6.3强化学习11

6.3.1强化学习基础11

6.3.2强化学习算法11

6.4深度学习框架与应用11

6.4.1主流深度学习框架11

6.4.2深度学习应用11

第7章文本挖掘与自然语言处理12

7.1文本预处理技术12

7.1.1文本清洗12

7.1.2停用词过滤12

7.1.3词干提取和词形还原12

7.2中文分词与词性标注12

7.2.1基于词典的分词方法12

7.2.2基于统计的分词方法12

7.2.3词性标注12

7.3文本分类与情感分析12

7.3.1文本分类13

7.3.2情感分析13

7.4命名实体识别与关系抽取13

7.4.1命名实体识别13

7.4.2关系抽取13

第8章社交网络分析13

8.1社交网络概述13

8.2社交网络数据的爬取与处理13

8.3社区发觉与影响力分析13

8.4社交网络中的链路预测14

文档评论(0)

1亿VIP精品文档

相关文档