- 3
- 0
- 约小于1千字
- 约 14页
- 2017-06-10 发布于江西
- 举报
浅谈数据挖掘_丽娜
浅谈数据挖掘
王亚伟
大纲
数据挖掘基本概念
数据预处理
数据挖掘常用算法
数据挖掘的基本概念
数据挖掘定义
简单的说,数据挖掘是指从大量数据中提取或“挖掘”知识。
数据挖掘也有也称为: 数据中的知识发现或者KDD(Knowledge Discovery in Databases)
数据挖掘的基本概念
数据仓库
多个异构数据源在单个站点以统一的模式组织的储存库,以支持管理决策。
数据仓库技术包括:数据清理、数据集成、和联机分析处理
数据挖掘的基本概念
数据清理(消除噪声和不一致数据)
数据集成(多种数据源可以集成在一起)
数据选择(从数据库中提取与分析任务相关的数据)
数据变换(数据变换或统一成适合挖掘的形式,如通过汇总或聚集操作)
数据挖掘(基本步骤,使用智能方法提取数据模式)
模式评估(根据某种兴趣度度量,识别表示知识的真正有趣的模式)
知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)
数据挖掘系统的主要成分
数据预处理
原因:
不完整(缺少属性值或者某些感兴趣的属性)
含有噪声(包含错误或存在偏离期望的离群点)
不一致
。。。。。
预处理:数据清理、数据集成、数据变换、数据归约
数据挖掘常用算方法
关联规则挖掘: 在给定数据集合中,寻找有意思的关联关系的过程
关联规则挖掘算法
Apriori等算法
FP-growth算法
分类和预测算法
分类是预测分类标号,预测是
您可能关注的文档
最近下载
- 2025年全国高考(新课标)物理真题卷含答案解析.docx VIP
- 2025全国高中数学联赛河南预赛试题及答案(高一).doc VIP
- 2025年人教版五年级下学期语文期中考试测试卷01.pdf VIP
- 工期进度计划及保证措施.docx VIP
- 2016高考全国新课标3卷物理含答案解析.doc VIP
- 民法典侵权责任编.ppt VIP
- 太阳能车棚设计.doc VIP
- 光学玻璃性能手册.pdf
- AP宏观经济学 2018年真题 (选择题+问答题) AP Macroeconomics 2018 Released Exam and Answers (MCQ+FRQ).pdf VIP
- 《系统工程 第6版》 课件全套 汪应洛 第1--8章 系统工程概述--- 系统工程应用实例.pptx
原创力文档

文档评论(0)