- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
;引入案例;知识解析;任务5.3利用Pandas进行数据的分组与分段分析;一、数据分组;groupby()函数常用参数说明;【做中学5.3.1】读入应收账款统计表.xlsx(位置:E:\file\),使用groupby()函数按年进行分组,并查看分组数据。;使用get_group()函数查看某一分组。程序如下:
df.groupby(年).get_group(2019)#查看组名是2019的分组;二、分组统计;【做中学5.3.2】读入应收账款统计表.xlsx(位置:E:\file\),统计2020年不同客户的本期发生额的总数及期初余额的平均数。;统计2020年不同客户应收账款期初余额的平均数。程序如下:
df1.groupby(客户ID)[期初余额].mean();importpandasaspd#引入pandas模块
#读取Excel表格数据
df=pd.read_excel(rE:\file\应收账款统计表.xlsx,converters={年:str,月:str})
df.groupby(年)[[本期发生额,期初余额]].agg([mean,sum,max,min]);【做中学5.3.4】接续【做中学5.3.3】使用groupby()函数按“年”进行分组,并统计各组本期发生额列的合计值、平均值,期初余额列的最小值。;5.2.2数据分段统计分析;【做中学5.3.6】读入公司资产负债率.xlsx(位置:E:\file\),根据资产负债率的分段情况进行统计。;0(24.437,45.467]
1(45.467,66.433]
2(45.467,66.433]
3(45.467,66.433]
4(66.433,87.4]
5(45.467,66.433]
Name:资产负债率(%),dtype:category
Categories(3,interval[float64]):[(24.437,45.467](45.467,66.433](66.433,87.4]]
分段统计结果为:
(45.467,66.433]4
(24.437,45.467]1
(66.433,87.4]1
Name:资产负债率(%),dtype:int64;指定区间进行分割并指定labels,再进行统计,程序如下:
cat2=pd.cut(df[资产负债率(%)],bins=[0,50,55,60,70,100],
labels=[优秀,良好,平均,较低,较差])
print(cat2)
print(分段统计结果为:)
print(cat2.value_counts());读入fin_data2.xlsx(位置:E:\file\)中的利润表项目,按年进行分组,并查看2021年的分组数据。程序如下:
importpandasaspd#导入Pandas模块
#读入Excel表格数据
df=pd.read_excel(rE:\file\fin_data2.xlsx,sheet_name=1,
converters={年:str,月:str})
grouped=df.groupby(年)#按年进行分组
grouped.get_group(2021).head();任务实训
您可能关注的文档
- 大数据技术在财务中的应用 教案全套 张卫平 项目1--7 认知数据分析--- 利用Pandas进行财务报表分析.docx
- 大数据技术在财务中的应用(Python版) 课件 任务1.1 了解数据的分析方法.pptx
- 大数据技术在财务中的应用(Python版) 课件 任务1.2 Python开发环境的搭建.pptx
- 大数据技术在财务中的应用(Python版) 课件 任务2.1 Python基础语法.pptx
- 大数据技术在财务中的应用(Python版) 课件 任务2.2 Python数据类型.pptx
- 大数据技术在财务中的应用(Python版) 课件 任务2.3 Python流程控制语句.pptx
- 大数据技术在财务中的应用(Python版) 课件 任务2.4 Python函数.pptx
- 大数据技术在财务中的应用(Python版) 课件 任务3.1 Numpy的基本操作.pptx
- 大数据技术在财务中的应用(Python版) 课件 任务3.2 Numpy的统计分析.pptx
- 大数据技术在财务中的应用(Python版) 课件 任务4.1 Pandas的基本操作.pptx
文档评论(0)