Python数据挖掘第三章-数据预处理.pptx

  1. 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
  2. 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  3. 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

Python数据挖掘数第三章据预处理

前言原始数据或多或少会存在一些问题,比如可能会有缺失值、异常值和重复值,不同来源的原始数据可能以不同的格式和结构存在,原始数据可能以不同的形式和单位表示,这些问题会影响到数据挖掘与分析的效率和准确性。直接使用未经预处理的原始数据,就像是在没有指南针的情况下航海,可能会导致偏离真实的数据挖掘与分析结果模型预测。

目录概述数据集成数据清洗数据变换

01概述

未经处理过的数据可能会造成的影响例3-1一个典型的例子是在进行客户细分时,如果原始数据集包含大量缺失值和异常值的数据集。1.缺失值的影响如果客户的某些重要属性数据缺失,将这些客户归入任何一个细分群体都可

文档评论(0)

弹弹 + 关注
实名认证
内容提供者

人力资源管理师、教师资格证持证人

该用户很懒,什么也没介绍

版权声明书
用户编号:6152114224000010
领域认证该用户于2024年03月13日上传了人力资源管理师、教师资格证

1亿VIP精品文档

相关文档