- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Python数据挖掘数第三章据预处理
前言原始数据或多或少会存在一些问题,比如可能会有缺失值、异常值和重复值,不同来源的原始数据可能以不同的格式和结构存在,原始数据可能以不同的形式和单位表示,这些问题会影响到数据挖掘与分析的效率和准确性。直接使用未经预处理的原始数据,就像是在没有指南针的情况下航海,可能会导致偏离真实的数据挖掘与分析结果模型预测。
目录概述数据集成数据清洗数据变换
01概述
未经处理过的数据可能会造成的影响例3-1一个典型的例子是在进行客户细分时,如果原始数据集包含大量缺失值和异常值的数据集。1.缺失值的影响如果客户的某些重要属性数据缺失,将这些客户归入任何一个细分群体都可
原创力文档


文档评论(0)