数据预处理与清理数据.pptVIP

  • 96
  • 0
  • 约4.84千字
  • 约 36页
  • 2017-05-23 发布于广东
  • 举报
数据预处理与清理数据

* 离散化:聚类分析方法 将数据按照“类内最大相似度,类间最小相似度的原则”对数据进行有效聚类 利用聚类的中心点来表示该类所包含的对象 数据聚类将非常有效,但是必须保证数据中没有噪音数据 * * 本节结论 数据的预处理无论对于数据仓库和数据挖掘都是非常重要的一个环节 数据预处理包括 数据清理 数据集成 数据归约和特征选取 数据的离散化 数据预处理涉及面广,现已建立了一系列的方法,但是目前仍然是一个非常活跃的研究领域 * * 简介:可视化数据挖掘 可视化: 使用计算机图形学创建可视化图像,帮助用户理解复杂,大规模数据 可视化数据挖掘: 使用可视化技术,从大规模数据集中发现隐含,有用知识的过程 可视化的目的 提供对大规模数据集定性的理解 查看数据中的模式,趋势,结构,不规则性,关系等 帮助寻找感兴趣的区域,为进一步定量分析提供合适的参数 为计算机得出的结果提供可视化的证明 * * 可视化与数据挖掘的结合 数据可视化 数据挖掘结果可视化 数据挖掘过程可视化 交互式可视化数据挖掘 * * 数据挖掘过程可视化 将数据挖掘各种处理过程用可视化的方式呈现给用户,可以看到: 数据是如何被提取的 是从哪个数据库或数据仓库提取的数据 被选择数据如何被清理,整合,处理和挖掘的 在数据挖掘中采用什么方法 数据被存储在哪里 * * 交互式可视化数据挖掘 使用可视化工具在数据挖掘过程中帮助用户作出更加合理的

文档评论(0)

1亿VIP精品文档

相关文档