数据处理与统计分析:分组、聚合、转换及过滤.pptx

数据处理与统计分析:分组、聚合、转换及过滤.pptx

数据分组

应用groupby进行分组对分组数据进行聚合,转换和过滤应用自定义函数处理分组之后的数据

聚合转换过滤DataFrameGroupBy对象

介绍在SQL中我们经常使用GROUPBY将某个字段,按不同的取值进行分组,在pandas中也有groupby函数分组之后,每组都会有至少1条数据,将这些数据进一步处理返回单个值的过程就是聚合,比如分组之后计算算术平均值,或者分组之后计算频数,都属于聚合

1.1单变量分组聚合加载数据df=pd.read_csv(data/gapminder.tsv,sep=\t’)groupby语句创建若干组#对year字段分组,会将数据中不同年份作为分组结果df.groupby(year).lifeExp.mean()#查询年份years=df.year.unique()

1.1单变量分组聚合上面groupby之后取平均的结果,也可以手动计算groupby语句会针对每个不同年份重复上述过程,并把所有结果放入一个DataFrame中返回mean函数不是唯一的聚合函数,Pandas内置了许多方法,都可以与groupby语句搭配使用

1.2Pandas内置的聚合方法可以与groupby一起使用的方法和函数

1.2Pandas内置的聚合方法上图都是可以与groupby一起使用的方法和函数前面例子中分组之后取平均也可

文档评论(0)

1亿VIP精品文档

相关文档