分布式数据挖掘.pptVIP

  • 9
  • 0
  • 约4.28千字
  • 约 19页
  • 2019-06-15 发布于天津
  • 举报
分布式数据挖掘 张敏灵 陈兆乾 周志华 zml@ai.nju.edu.cn 南京大学软件新技术国家重点实验室 2002.10.11 提纲 简介 数据挖掘 分布式数据挖掘 研究现状 同构与异构 分布式数据挖掘算法 应用实例 进一步的工作 简介-数据挖掘 什么是数据挖掘? 数据挖掘是指从巨量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。(From U. Fayyad et al.’s definition at KDD96) 巨量的:对于少量数据的分析不需要使用数据挖掘。 有效的:所获得的模式必须是正确的。 新颖的:对于已知知识的投资收益不大。 潜在有用的:所得的模式应能提供相关的决策支持。 最终可理解的:所得的模式是提交给决策制定者的。 数据挖掘的研究领域 数据挖掘是一门涉及机器学习、统计学、数据库、可视化技术、高性能计算等诸多方面的交叉学科。 数据挖掘-续 数据挖掘的应用范围 描述性规则发现(Characterization) 对比性规则发现(Discrimination) 关联规则发现(Association) 分类分析(Classification) 预测(回归)分析(Prediction) 聚类分析(Clustering) 异常分析(Outlier an

文档评论(0)

1亿VIP精品文档

相关文档