- 3
- 0
- 约小于1千字
- 约 65页
- 2016-07-21 发布于湖北
- 举报
第一讲学材数据预处理概述
数据预处理;为什么对数据进行预处理
描述性数据汇总
数据清理
数据集成和变换
数据归约
离散化和概念分层生成;为什么进行数据预处理?;数据为什么会变“脏”?;数据预处理为什么是重要的?;数据质量的多维度量;数据预处理的主要任务;;为什么对数据进行预处理
描述性数据汇总
数据清理
数据集成和变换
数据归约
离散化和概念分层生成;描述性数据汇总;度量的分类;度量中心趋势 (1);度量中心趋势 (2);对称 VS. 倾斜的数据;度量数据的离散度 (1);度量数据的离散度 (2);盒图——示例;使用盒图的数据离散的可视化描述;基本统计类描述的图形显示——直方图;分位数图;分位数-分位数图(Q-Q 图);散布图;LOESS曲线;为什么对数据进行预处理
描述性数据汇总
数据清理
数据集成和变换
数据归约
离散化和概念分层生成;数据清理;空缺值;如何处理空缺值;噪声数据;如何处理噪声???据 ;数据平滑的分箱方法;聚类;离群点检测;回归;数据清理做为一个过程 (1);数据清理做为一个过程 (2);为什么对数据进行预处理
描述性数据汇总
数据清理
数据集成和变换
数据归约
离散化和概念分层生成;数据集成;处理数据集成中的冗余数据;分类(离散)数据的相关性分析;数据变换 ;数据变换——规范化;;为什么对数据进行预处理
描述性数据汇总
数据清理
数据集成和变换
数据归约
离散化和概念分层生成;数据归约
您可能关注的文档
最近下载
- Micromeritics ASAP2020 全自动物理和化学吸附用户手册.pdf
- 甲醇精馏塔毕业设计(优.选).docx VIP
- 2026届高考必备名著阅读之《红楼梦》复习课件.pptx VIP
- 计算机应用基础 实训项目四 PowerPoint 综合应用.ppt VIP
- 施耐德培训讲义04开关的选择性、限流和级联技术介绍教学文稿.ppt VIP
- (辐射防护与核安全)辐射防护工程试题及答案.doc VIP
- 20S515 钢筋混凝土及砖砌排水检查井.docx VIP
- 新材料专题:微玻纤无边界成长.pdf
- 七年级历史期末考试卷.docx VIP
- GB30871-2022动火作业票填写模板.docx VIP
原创力文档

文档评论(0)