网站大量收购独家精品文档,联系QQ:2885784924

大数据技术在财务中的应用(Python版) 课件 任务4.1 Pandas的基本操作.pptx

大数据技术在财务中的应用(Python版) 课件 任务4.1 Pandas的基本操作.pptx

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;;;引入案例;知识解析;Pandas包含Series和DataFrame两种数据类型,其中DataFrame数据类型就相当于Excel表格数据的行和列,而Series数据类型就相当于Excel表中的一列或一行。;1.Series对象的创建;【做中学4.1.1】编写程序,分别利用列表、一维数组和字典创建Series。;2.Series对象的数据查询;查询方式;查询方式;3.Series对象的修改、增加及删除;操作;DataFrame数据结构如下图所示,与Series类似,也是由索引和数据构成,不同的是,DataFrame的索引不仅有行索引,还有列索引。行索引用index表示,列索引用columns表示,如果没有传入行索引或列索引,DataFrame会默认自动创建一个从0开始的整数索引,这种索引称为自动索引或原始索引。行索引位于最左边一列,而列索引位于最上面一行。;4.1.2DataFrame创建方法与属性;创建方法;【做中学4.1.2】拟创建如下图所示的DataFrame对象,可以采用的创建方法如下表所示。;二、DataFrame的属性;4.1.3DataFrame的基本操作;索引操作;索引操作;【做中学4.1.3】编写程序实现下图所示DataFrame对象索引的变化。;二、新增列数据;【做中学4.1.4】编写程序,要求采用三种不同的方法实现下图中DataFrame对象列的增加。;三、删除列数据;【做中学4.1.5】编写程序以下操作:对【做中学4.1.4】最终生成的DataFrame对象df使用del、pop()、drop()方法进行删除操作,如下图所示。;四、行数据的增加和删除;四、DataFrame的转置及数据类型转换;(2)对df进行转置操作。程序如下:

df.T#转置操作,T为转置运算符;4.1.3DataFrame的简单运算;二、DataFrame的简单运算;importnumpyasnp#导入Numpy模块

importpandasaspd#导入Pandas模块

data={公司:[一分厂,二分厂,三分厂],

收入:[2000000,1500000,1300000],

成本:[1650000,1350000,1050000]}

df=pd.DataFrame(data)

df[毛利]=df[收入]-df[成本]

df[毛利率]=df[毛利]/df[收入‘]

df#查看df;4.1.3Pandas读写外部文件;read_excel()函数常用参数说明;read_excel()函数常用参数说明;利用to_excel()函数可以实现将DataFrame对象存储为Excel文件,其语法格式如下:

DataFrame.to_excel(excel_writer,sheet_name=Sheet1,na_rep=,float_format=None,columns=None,header=True,index=True,index_label=None,startrow=0,startcol=0,engine=None,merge_cells=True,encoding=None,inf_rep=inf,verbose=True,freeze_panes=None);【做中学4.1.10】利用Pandas模块读入fin_data1.xlsx(位置:E:\file\)中的第一个表格,根据数据表中的数据计算毛利和毛利率,然后将加工过的表格导出一个新的excel文件,存放位置为:E:\file\,命名为fin_data2.xlsx。;根据DataFrame对象df计算毛利和毛利率。其程序如下:

df[毛利]=df[营业收入]-df[营业成本]

df[毛利率]=df[毛利]/df[营业收入]

df.head()#默认查看df的前5行数据;二、读写CSV文件;CSV文件的存储可以通过Pandas库中的to_csv()函数实现,其语法格式如下:

DataFrame.to_csv(path_or_buf=None,sep=,,na_rep=,float_format=None,columns=None,header=True,index=True,index_label=None,mode=w,encoding=None,…);【做中学4.1.11】解析如下:;计算营业净利率。程序如下:

df[营业净利率]=df[净利润]/df[营业收入]

df.head()#查看df前5行数据;将df存储为一个新的CSV文件。程序如下:

df.to_csv(rE:\file\fin_data1.csv,index=False);案例解析

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档