浅谈数据挖掘_丽娜.pptVIP

  • 3
  • 0
  • 约小于1千字
  • 约 14页
  • 2017-06-10 发布于江西
  • 举报
浅谈数据挖掘_丽娜

浅谈数据挖掘 王亚伟 大纲 数据挖掘基本概念 数据预处理 数据挖掘常用算法 数据挖掘的基本概念 数据挖掘定义 简单的说,数据挖掘是指从大量数据中提取或“挖掘”知识。 数据挖掘也有也称为: 数据中的知识发现或者KDD(Knowledge Discovery in Databases) 数据挖掘的基本概念 数据仓库 多个异构数据源在单个站点以统一的模式组织的储存库,以支持管理决策。 数据仓库技术包括:数据清理、数据集成、和联机分析处理 数据挖掘的基本概念 数据清理(消除噪声和不一致数据) 数据集成(多种数据源可以集成在一起) 数据选择(从数据库中提取与分析任务相关的数据) 数据变换(数据变换或统一成适合挖掘的形式,如通过汇总或聚集操作) 数据挖掘(基本步骤,使用智能方法提取数据模式) 模式评估(根据某种兴趣度度量,识别表示知识的真正有趣的模式) 知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识) 数据挖掘系统的主要成分 数据预处理 原因: 不完整(缺少属性值或者某些感兴趣的属性) 含有噪声(包含错误或存在偏离期望的离群点) 不一致 。。。。。 预处理:数据清理、数据集成、数据变换、数据归约 数据挖掘常用算方法 关联规则挖掘: 在给定数据集合中,寻找有意思的关联关系的过程 关联规则挖掘算法 Apriori等算法 FP-growth算法 分类和预测算法 分类是预测分类标号,预测是

文档评论(0)

1亿VIP精品文档

相关文档