- 10
- 0
- 约2.09万字
- 约 26页
- 2016-12-13 发布于贵州
- 举报
数据挖掘课程复习提纲(10计算机、软件、网络)
有关考试
题型:
一、填空题(15分,每空1分)
二、判断题(10分,每题1分)
三、计算题(55分,4大题,1~3大题各15分,第4大题10分)——聚类、分类、关联分析、异常挖掘各一题
四、问答题(20分,3题,分别是7分,6分,和7分题)
基本要求:掌握数据预处理、分类、聚类、关联分析、异常挖掘的基本方法、clementine的基本使用方法,及每类方法的应用场景(每类方法理解、熟悉一个例子)。算法重点掌握k-means、一趟聚类、DBSCAN、ID3(C4.5)、Bayes、KNN、Apriori及基于距离、密度、聚类的异常检测方法。
第一章 绪论
1 数据挖掘的定义
技术层面:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中、人们事先不知道的、但又潜在有用的信息和知识的过程。
商业层面:数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。
2 数据挖掘的任务
预测任务:根据其它属性的值预测特定(目标)属性的值,如回归、分类、异常检测。
描述任务:寻找概括数据中潜在联系的模式,如关联分析、演化分析、聚类分析、序列模式挖掘。
(1) 关联(Association)分析
关联分析,发现特征之间的相互
您可能关注的文档
最近下载
- AI应用深度报告:应用分类、国内外现状、商业化进程、未来趋势及相关公司深度梳理.pptx VIP
- 湖南省长沙市雅礼教育集团2025届九年级中考一模道德与法治试卷(含答案).docx VIP
- 通风工程施工方案.doc VIP
- 危险化学品特种作业人员培训聚合工艺32课件.pptx
- 湖南省长沙市雅礼教育集团2025届九年级中考一模道德与法治试卷(含答案).pdf VIP
- 通风工程施工方案.docx VIP
- 行路难三首 李白 唐诗 硬笔书法 临摹 楷体.pdf VIP
- 模板工程专项施工方案.docx
- 学前教育管理期末考试复习指导.docx VIP
- 2025年副高卫生职称-临床医学检验学技术-临床医学检验技术(副高)[代码:070]历年参考题典型考.docx VIP
原创力文档

文档评论(0)