python数据科学课件12-pandas基础(五).pptxVIP

  • 0
  • 0
  • 约3.78千字
  • 约 28页
  • 2026-03-13 发布于广西
  • 举报

python数据科学课件12-pandas基础(五).pptx

Pandas基础

(五)

课前回顾

1、合并数据

2、清洗数据

合并数据是把不同的数据按照既定规则整合起来,这会帮助我们更好的在后期的数据处理和分析中减少筛选数据的时间

数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。

情境引入

在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。并且会经常根据需求来转换数据,以达到相应的要求。

循序善诱

在现实生活中,一个目标变量(y)可以认为是由多个特征变量(x)影响和控制的,那么这些特征变量的量纲和数值的量级就会不一样,比如x1=10000,x2=1,x3=0.5可以很明显的看出特征x1和x2、x3存在量纲的差距;x1对目标变量的影响程度将会比x2、x3对目标变量的影响程度要大,对数据标准化的目的是消除特征之间的差异性。

循序善诱

在很多算法模型中都对数据有着很多的要求,为了方便管理操作数据,我们经常会对原始数据进行转换。

本节课让我们一起来学习如何将数据标准化以及如何来转换数据。

新知教授

2、转换数据

1、标准化数据

3、课堂总结

标准化数据

新知教授

数据标准化目的是处理不同规模和量纲的数据,使其缩放到相同的数据区间和范围,以减少规模、特征、分布差异等的影响。

思维构建

离差标准化数据

离差标准化是对原始数据的一种线

文档评论(0)

1亿VIP精品文档

相关文档