第二届全国高校数据驱动创新研究大赛﹒北京大学
数据预处理方法数据预处理方法
王继民王继民
北京大学信息管理系北京大学信息管理系
年1111 月月1919 日日
基本内容
引言
数据预处理的主要方法
数据清理
数据集成
数据变换
数据归约
数据离散化
工具软件
信息管理系
引言:数据挖掘及步骤
数据挖掘:是指从数据集中识别出有效的、新颖的、
潜在有用的,以及最终可理解的模式的非平凡过程
数据挖掘的步骤:
数据准备:数据搜集与数据预处理
数据挖掘算法的选择
结果的解释评估
原创力文档

文档评论(0)