03数据预处理.pptVIP

  • 5
  • 0
  • 约1.88千字
  • 约 27页
  • 2016-12-05 发布于重庆
  • 举报
03数据预处理

生物医学数据挖掘 Biomedical Data Mining 上海交通大学医学院 计算机应用教研室 龚著琳 回顾 第一章 概论 四.数据挖掘性能评价 第二章 数据采集与准备 一.数据的采集和组织 1. 数据采集和管理 2. 数据的组织 3. 数据的类型 第二章 数据采集与准备 一.数据的采集和组织 二.数据预处理 1. 目的 2. 数据的分布状态 3. 数据清洗 4. 数据整合 5. 数据变换 6. 数据精简 数据预处理 1.目的 ① 提高数据的质量 处理不好的数据 降低维数 ② 数据质量的表现 完整性 合理性 一致性 No quality data, no quality mining results! 第二章 数据采集与准备 一.数据的采集和组织 二.数据预处理 1. 目的 2. 数据的分布状态 3. 数据清洗 4. 数据整合 5. 数据变换 6. 数据精简 数据预处理 2.数据的分布状态 用统计学工具可解决 数据分布趋势(P18):均值、中值、众数、半程位、 数据散布特性(P19):全程范围、四分位数、四分位范围、标准差 例 P19 收缩压,排序 数据预处理的形式 第二章 数据采集与准备 一.数据的采集和组织 二.数据预处理 1. 目的 2. 数据的分布状态 3. 数据清洗 4. 数据整合 5. 数据变换 5. 数据精简 数据预处理 3.

文档评论(0)

1亿VIP精品文档

相关文档