- 13
- 0
- 约1.61万字
- 约 18页
- 2025-06-17 发布于河北
- 举报
大数据挖掘与分析教程
第1章大数据概述3
1.1大数据的发展历程3
1.2大数据的概念与特征4
1.3大数据的应用领域4
第2章数据预处理5
2.1数据清洗5
2.1.1除噪声5
2.1.2处理异常值5
2.1.3删除重复数据5
2.1.4处理缺失值5
2.2数据整合5
2.2.1数据集成6
2.2.2冗余数据处理6
2.2.3数据一致性处理6
2.3数据转换6
2.3.1数据离散化6
2.3.2数据分组6
2.3.3特征提取6
2.4数据归一化与标准化6
2.4.1数据归一化6
2.4.2数据标准化6
第3章数据仓库与OLAP技术7
3.1数据仓库的构建与设计7
3.1.1数据仓库的基本概念7
3.1.2数据仓库的架构7
3.1.3数据仓库的设计方法7
3.1.4数据仓库的建模7
3.2联机分析处理(OLAP)技术7
3.2.1OLAP的基本概念7
3.2.2OLAP的类型7
3.2.3OLAP操作8
3.3数据立方体的构建与操作8
3.3.1数据立方体的构建8
3.3.2数据立方体的操作8
3.4多维数据分析方法8
3.4.1聚合分析8
3.4.2数据切片与切块8
3.4.3数据钻取8
3.4.4数据旋转8
第4章数据挖掘算法8
4.1美联规则挖掘9
4.2聚类分析9
4.3分类与预测9
4.4时间序列分析9
第5章统计分析与数据挖掘9
5.1描述性统计分析9
5.2假设检验与置信区间9
5.3回归分析10
5.4主成分分析与因子分析10
第6章机器学习与深度学习10
6.1监督学习10
6.1.1线性回归10
6.1.2逻辑回归10
6.1.3支持向量机10
6.2无监督学习10
6.2.1聚类11
6.2.2降维11
6.3强化学习11
6.3.1强化学习基础11
6.3.2强化学习算法11
6.4深度学习框架与应用11
6.4.1主流深度学习框架11
6.4.2深度学习应用11
第7章文本挖掘与自然语言处理12
7.1文本预处理技术12
7.1.1文本清洗12
7.1.2停用词过滤12
7.1.3词干提取和词形还原12
7.2中文分词与词性标注12
7.2.1基于词典的分词方法12
7.2.2基于统计的分词方法12
7.2.3词性标注12
7.3文本分类与情感分析12
7.3.1文本分类13
7.3.2情感分析13
7.4命名实体识别与关系抽取13
7.4.1命名实体识别13
7.4.2关系抽取13
第8章社交网络分析13
8.1社交网络概述13
8.2社交网络数据的爬取与处理13
8.3社区发觉与影响力分析13
8.4社交网络中的链路预测14
第
您可能关注的文档
- 安全员个人年终总结范文(32篇).pdf
- 大数据驱动的图书市场分析模型.pdf
- 安全员个人总结(24篇).pdf
- 大数据驱动下的期刊内容评估与优化.pdf
- 大数据时代的话语分析.pdf
- 大数据时代的网络空间安全风险与防御.pdf
- 大数据挖掘分析建模系统项目(第二次).pdf
- 安全员总结(32篇).pdf
- 大数据下职业能力评估.pdf
- 安全之星范文(47篇).pdf
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测生物试卷+答案.doc
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测语文试卷+答案.doc
- 四川省绵阳南山中学实验学校2025-2026学年高三上学期1月月考数学含答案.doc
- 2026届辽宁省大连市高三上学期双基考试物理试卷+答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测化学含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测生物含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测英语含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测政治含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试化学含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试生物含答案.doc
最近下载
- 广州数控GSK980TA1-TA2-TB1-TB2车床数控系统 使用手册.pdf
- 虚实乱针绣入门.ppt VIP
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验.pdf
- 曲柄连杆机构的运动与受力分析讲解学习.pptx VIP
- 如此伟大的爱G波利切un amore cosi grande G-E-G-F-5P.pdf VIP
- 钛白废酸废水综合治理项目可行性研究报告.docx
- 陕09J02-屋面-标准图集.docx
- 中药当归中阿魏酸的提取工艺研究.pptx
- 蔬菜大棚建设实施方案范文(8篇).docx VIP
- 结合多源异构数据融合技术的人口增长时空预测模型构建及应用分析.pdf VIP
原创力文档

文档评论(0)