数据分组
应用groupby进行分组对分组数据进行聚合,转换和过滤应用自定义函数处理分组之后的数据
聚合转换过滤DataFrameGroupBy对象
介绍在SQL中我们经常使用GROUPBY将某个字段,按不同的取值进行分组,在pandas中也有groupby函数分组之后,每组都会有至少1条数据,将这些数据进一步处理返回单个值的过程就是聚合,比如分组之后计算算术平均值,或者分组之后计算频数,都属于聚合
1.1单变量分组聚合加载数据df=pd.read_csv(data/gapminder.tsv,sep=\t’)groupby语句创建若干组#对year字段分组,会将数据中不同年份作为分组结果df.groupby(year).lifeExp.mean()#查询年份years=df.year.unique()
1.1单变量分组聚合上面groupby之后取平均的结果,也可以手动计算groupby语句会针对每个不同年份重复上述过程,并把所有结果放入一个DataFrame中返回mean函数不是唯一的聚合函数,Pandas内置了许多方法,都可以与groupby语句搭配使用
1.2Pandas内置的聚合方法可以与groupby一起使用的方法和函数
1.2Pandas内置的聚合方法上图都是可以与groupby一起使用的方法和函数前面例子中分组之后取平均也可
您可能关注的文档
- 2020-2024年模拟试题与应用示例.pdf
- 大气运动考点专项练习:选择题.pdf
- DBJ04_T 411-2020 城市轨道交通设施设备分类编码标准.docx
- DB4419_T 17-2024 教育基础数据.docx
- DBJ41_T 184-2020 河南省居住建筑节能设计标准(寒冷地区75%).docx
- T∕ZZB 1040-2019 仪器设备用轴流风扇.docx
- DBJ∕T 15-104-2015 预拌砂浆混凝土及制品企业试验室管理规范.docx
- T∕ZZB 0979-2019 硅藻土彩泥标准规范.docx
- DB11_T 2463-2025 城市道路隧道设计标准.docx
- DB61_T 5078-2023 体育建筑工艺设计标准.docx
- DB43∕T 1224-2016 生物质燃料工业锅炉节能监测.docx
- DB32_T 5272-2025 既有建筑节能改造技术规程.docx
- DB23∕T 2418-2019 黑龙江省建筑工程质量鉴定技术标准.docx
- DB5101∕T 13-2018 成都市智慧城市市政设施 城市道路桥梁基础数据规范.docx
- DB11∕1444-2017 城市轨道交通隧道工程注浆技术规程.docx
- DB62_T 3228-2022 泥石流工程防治技术规程.docx
- DB64_T 2127-2025 装配式钢结构工程施工工艺标准.docx
- DB53_T 1371-2025 动物检疫申报点建设与管理规范.docx
- DB3716_T 76-2024 中介超市项目选取服务规范.docx
- T_CI 947-2025 薄壁钢筒混凝土压力管结构设计规范.docx
原创力文档

文档评论(0)