- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
项目七统计计算与分组运算
目标掌握Pandas的统计运算方法掌握Pandas的排序操作掌握Pandas分组统计方法
任务一MG公司2023年销售数据的统计计算
相关知识_常见的统计函数求最大值和最小值:max()、min()函数求均值:mean()函数求和:sum()函数统计描述函数:describe()函数
常见的统计函数以文件profits.xlsx中的数据为例进行一些常见的统计计算
求最大值和最小值说明:省略max()和min()函数的axis参数时,默认axis=0,表示按列纵向求最大或最小值。当axis=1时,表示按行求每行的最大或最小值。注意计算时对所有列(或行)进行计算。
求均值说明:mean()函数表示求均值,DataFrame的统计函数中都默认优先按列纵向计算,如果需要对每行的数据计算,在调用这些统计函数时,设置axis=1即可。按列计算按行计算
求和说明:本次求和的结果作为新的一行,添加到profitDF数据集的末尾。当loc方法的行标签参数是数据集中不存在的标签时,将在数据集中增加对应的标签。如果直接求和,执行profitDF.sum()代码,结果会是什么样的?
统计描述函数说明:1.可以一次性完成多个统计指标计算。2.该函数输出了数据集的count(行数)、mean(平均值)、std(标准差)、min(最小值)、25%(第一四分位数)、50%(第二四分位数)、75%(第三四分位数)、max(最大值)3.该函数在分析一个较大的文件时,作为初步的分析工具是非常有用的describe()函数
任务二MG公司2023年销售数据的排序
相关知识数据排序:按索引名排序、按值排序分位数函数:quantile()函数
按索引名排序sort_index()方法专门用于按数据集的索引标签名进行排序
按值排序sort_values()方法用于将数据集按值进行排序说明:参数by表示按指定的值排序
分位数函数quantile()函数是分位数函数说明:可使用参数q表示要计算的分位数,q取值范围为0=q=1营业总收入的二分位数是2534703976.32,这表明有一半的营业总收入大于此数,有一半的营业总收入小于此数profitDF[营业总收入].quantile()#省略了参数q=0.5,默认为二分位数按照列索引的方法代码如何写?
任务三MG公司2023年销售数据的分组统计
相关知识分组与聚合的原理groupby()方法
分组与聚合的原理分组是指使用特定的条件将原数据划分为多个组聚合是对每个分组中的数据执行某些操作,最后将计算的结果进行整合
groupby()方法将数据集按照某些标准划分成若干个组groupby(by=None,axis=0,sort=True)其中:by:用于确定进行分组的依据。axis:表示分组轴的方向。sort:表示是否对分组标签进行排序,接收布尔值,默认为True。
groupby()方法以下列数据为例
groupby()方法以“data1”为依据分组,对每个分组求均值和求和
groupby()方法查看分组情况
groupby()方法
您可能关注的文档
- 财务大数据基础(第二版)课件 项目二 Python环境搭建与使用.pptx
- 财务大数据基础(第二版)课件 项目六 数据分析工具Pandas入门.pptx
- 财务大数据基础(第二版)课件 项目十 数据分析与可视化.pptx
- 财务大数据基础(第二版)课件 项目一 财务大数据认知.pptx
- 财务大数据基础(第二版)技能训练参考答案汇总 高翠莲 项目6--10.docx
- 财务大数据基础(第二版)技能训练参考答案汇总 高翠莲 项目1--5.docx
- 贵州省贵阳市第六中学2017-2018学年高二3月月考卷B英语试题扫描版.doc
- 四川省广安眉山内江遂宁高三第三次诊断性考试文综历史试题扫描版含答案.doc
- 山西省忻州市2017-2018学年高二上学期期末考试化学试题扫描版含答案.doc
- 安徽省合肥市高三第二次质量检测生物试卷扫描版含答案.doc
- 河南省郑州市第一中学2017-2018学年高一下学期周测物理试题(325)扫描版含答案.doc
- 山西省怀仁县第一中学2017-2018学年高二下学期第一次月考生物试题扫描版.doc
- 河南省六市高三下学期第一次联考试题(3月)理科综合扫描版含答案.doc
- 四川省高三全国Ⅲ卷冲刺演练(一)文综地理试卷扫描版含答案.doc
- 河南省洛阳市高三第二次统考文综试卷扫描版含答案.doc
- 甘肃省靖远县高三下学期第二次联考理科综合试题扫描版含答案.doc
- 问题导学法在办公场景中的实施策略及效果评估.docx
- 退休后的个人品牌打造与传播策略.docx
- 问题解决在办公流程优化中的应用.docx
- 问题导向的办公环境创新设计.docx
最近下载
- 中国算力大会:中国综合算力指数(2024年).docx
- Part 5 Unit1Taking a Training Course 课件-【中职专用】高二英语(高教版2021·拓展模块)(2023修订版).pptx
- 护士长竞聘演讲模板.pptx VIP
- 《0~3岁婴幼儿亲子活动设计与指导》项目2 0-3岁婴幼儿亲子活动设计基本原则和方法 教学课件.pptx VIP
- 护士长竞聘演讲课件.pptx VIP
- 各种心理学简介.pdf VIP
- 库尔勒香梨密植高效栽培技术规程.pdf
- 急性呼吸窘迫综合征诊断和治疗指南.pdf
- 部编版小学语文三年级下册核心素养教案设计全册.docx
- 六年级下册-生命生态安全教案.pdf VIP
文档评论(0)