- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第3章数据处理包Pandas数据框(DataFrame)简介、创建数据框属性与方法数据框访问与切片
数据框(DataFram)简介第3章Pandas中另一个重要的数据对象为数据框(DataFram),由多个序列按照相同的index组织在一起形成一个二维表。事实上,数据框的每一列为序列。数据框的属性包括index、列名和值,均可以获取出来并进行操作。由于数据框是更为广泛的一种数据组织形式,许多外部数据文件读取到Python中大部分会采用数据框的形式进行存取,比如数据库、excel和TXT文本。同时数据框也提供了极为丰富的方法用于处理数据及完成计算任务。
数据框创建第3章基于字典,利用Pandas库中的DataFrame函数,可以创建数据框。其中字典的键转化为列名,字典的值转化为列值,而索引为默认值,即从0开始从小到大排列。importpandasaspdimportnumpyasnpdata={a:[2,2,np.nan,5,6],b:[‘kl’,’kl’,’kl’,np.nan,’kl’],’c’:[4,6,5,np.nan,6],’d’:[7,9,np.nan,9,8]}df=pd.DataFrame(data)
数据框属性第3章数据框对象具有三个属性,分别为列名、索引和值。以前面定义的df为例print(columns=,df.columns)print(-*50)print(index=,list(df.index))print(-*50)print(values=)print(df.values)输出结果为:columns=Index([a,b,c,d],dtype=object)--------------------------------------------------index=[0,1,2,3,4]--------------------------------------------------values=[[2.0kl4.07.0][2.0kl6.09.0][nankl5.0nan][5.0nannan9.0][6.0kl6.08.0]]
数据框方法第3章dropna()通过dorpna()方法,可以去掉数据集中的空值(nan值),需要注意的是原来数据集不发生改变,新数据集需要重新定义。df1=df.dropna()
数据框方法第3章fillna()通过fillna()方法,可以对数据框中的空值(nan值)进行填充。默认情况下所有空值填充同一个元素值(数值或者字符串),也可以指定不同的列填充不同的值。df2=df.fillna(0)#所有空值元素填充0df3=df.fillna(Kl)#所有空值元素填充kldf4=df.fillna({a:0,b:kl,c:0,d:0})#全部列填充df5=df.fillna({a:0,b:kl})#部分列填充
数据框方法第3章sort_values()可以利用sort_values()方法,指定列按值进行排序importpandasaspddata={a:[5,3,4,1,6],b:[d,c,a,e,q],c:[4,6,5,5,6]}Df=pd.DataFrame(data)Df1=Df.sort_values(a,ascending=False)#默认按升序,这里设置为降序
数据框方法第3章sort_index()有时候需要按索引进行排序,这时候可以使用sort_index()方法。Df2=Df1.sort_index(ascending=False)#默认按升序,这里设置为降序
数据框方法第3章head()通过head(N)方法,可以取数据集中的前N行,比如取前面定义的数据框Df2中的前4行。H4=Df2.head(4);
数据框方法第3章drop()利用dorp()方法,可以删掉数据集中的指定列。比如删除前面定义的H4中的b列。H41=H4.drop(b,axis=1)#需指定轴为1
数据框方法第3章join()利用join()方法,可以实现两个数据框之间的水平连接Df3=pd.DataFrame({d:[1,2,3,4,5]})Df4=Df.join(Df3)
数据框方法第3章to_excel()通过to_excel()方法,可以将数据框导出到Excel文件中,Excel文件中。importpandasaspdlist1=[a,b,c,d,e,f]list2=[1,2,3,4,5,6]list3=[1.4,3.5,2,6,7,8]list4=[4,5,6,7,8,9]list5=[t,5,6,7,k,9.6]
您可能关注的文档
- Python金融数据分析与挖掘(微课版) 课件 1-1. Python基本数据类型与基本数据结构.pptx
- Python金融数据分析与挖掘(微课版) 课件 1-2. Python公有方法.pptx
- Python金融数据分析与挖掘(微课版) 课件 1-3. Python基本数据结构方法.pptx
- Python金融数据分析与挖掘(微课版) 课件 2-1. 数组创建与操作.pptx
- Python金融数据分析与挖掘(微课版) 课件 2-2. 矩阵与线性代数运算.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-1.序列.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-3.外部文件读取.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-4.常用函数.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-5.常用计算任务.pptx
- Python金融数据分析与挖掘(微课版) 课件 -4. Python条件语句、循环语句与函数.pptx
最近下载
- 光纤激光打标机说明书用户手册.pdf
- ME4312应用指导V.1 2016.07.07微盟原厂规格书.pdf VIP
- 《铸造用砂圆形度检测方法》.pdf
- 2024年物业年终总结及明年计划报告.ppt
- 2023年浙江工业大学网络工程专业《操作系统》科目期末试卷A(有答案).docx VIP
- 美国德百世dv55全自动双水平呼吸机简易操作手册.pdf
- 2023年浙江工业大学软件工程专业《操作系统》科目期末试卷A(有答案).docx VIP
- 气血疏通中级班讲义.pdf VIP
- 2024年秋季新人教版九年级上册化学全册教学课件(新教材).pptx
- 十二烷基硫酸钠对黄锑矿浮选行为的影响及作用机理.pdf VIP
文档评论(0)