第一讲学材数据预处理概述.pptVIP

  • 3
  • 0
  • 约小于1千字
  • 约 65页
  • 2016-07-21 发布于湖北
  • 举报
第一讲学材数据预处理概述

数据预处理;为什么对数据进行预处理 描述性数据汇总 数据清理 数据集成和变换 数据归约 离散化和概念分层生成;为什么进行数据预处理?;数据为什么会变“脏”?;数据预处理为什么是重要的?;数据质量的多维度量;数据预处理的主要任务;;为什么对数据进行预处理 描述性数据汇总 数据清理 数据集成和变换 数据归约 离散化和概念分层生成;描述性数据汇总;度量的分类;度量中心趋势 (1);度量中心趋势 (2);对称 VS. 倾斜的数据;度量数据的离散度 (1);度量数据的离散度 (2);盒图——示例;使用盒图的数据离散的可视化描述;基本统计类描述的图形显示——直方图;分位数图;分位数-分位数图(Q-Q 图);散布图;LOESS曲线;为什么对数据进行预处理 描述性数据汇总 数据清理 数据集成和变换 数据归约 离散化和概念分层生成;数据清理;空缺值;如何处理空缺值;噪声数据;如何处理噪声???据 ;数据平滑的分箱方法;聚类;离群点检测;回归;数据清理做为一个过程 (1);数据清理做为一个过程 (2);为什么对数据进行预处理 描述性数据汇总 数据清理 数据集成和变换 数据归约 离散化和概念分层生成;数据集成;处理数据集成中的冗余数据;分类(离散)数据的相关性分析;数据变换 ;数据变换——规范化;;为什么对数据进行预处理 描述性数据汇总 数据清理 数据集成和变换 数据归约 离散化和概念分层生成;数据归约

文档评论(0)

1亿VIP精品文档

相关文档