《数据分析》课件——任务3.2 Pandas索引操作及高级索引.pptxVIP

  • 0
  • 0
  • 约1.79千字
  • 约 19页
  • 2026-03-11 发布于福建
  • 举报

《数据分析》课件——任务3.2 Pandas索引操作及高级索引.pptx

任务3.2Pandas索引操作及高级索引Python数据分析

学习目标及重难点学习目标:了解索引对象了解重置索引掌握Pandas的索引操作素养目标:了解索引操作学习重点:索引对象索引操作

目录学习内容1.索引对象3.索引操作2.重置索引

01索引对象

1.索引对象Pandas中的索引都是Index类对象,又称为索引对象,该对象是不可以进行修改的,以保障数据的安全。

1.索引对象Pandas还提供了很多Index的子类,常见的有如下几种:(1)Int64Index:针对整数的特殊Index对象。(2)MultiIndex:层次化索引,表示单个轴上的多层索引。(3)DatetimeIndex:存储纳秒寄时间戳。

02重置索引

2.重置索引Pandas中提供了一个重要的方法是reindex(),该方法的作用是对原索引和新索引进行匹配,也就是说,新索引含有原索引的数据,而原索引数据按照新索引排序。如果新索引中没有原索引数据,那么程序不仅不会报错,而且会添加新的索引,并将值填充为NaN或者使用fill_vlues()填充其他值。

2.重置索引reindex()方法的语法格式如下:index:用作索引的新序列。method:插值填充方式。fill_value:引入缺失值时使用的替代值。limit:前向或者后向填充时的最大填充量。DataFrame.reindex(labels=None,index=None,columns=None,axis=None,method=None,copy=True,level=None,fill_value=nan,limit=None,tolerance=None?)

2.重置索引如果不想填充为NaN,则可以使用fill_value参数来指定缺失值。ser_obj.reindex([a,b,c,d,e,f],fill_value=6)

2.重置索引如果期望使用相邻的元素值进行填充,则可以使用method参数,该参数对应的值有多个。

03索引操作

3.索引操作Series有关索引的用法类似于NumPy数组的索引,只不过Series的索引值不只是整数。如果我们希望获取某个数据,既可以通过索引的位置来获取,也可以使用索引名称来获取。ser_obj=pd.Series([1,2,3,4,5],index=[a,b,c,d,e])ser_obj[2]#使用索引位置获取数据ser_obj[c]#使用索引名称获取数据

3.索引操作如果使用的是位置索引进行切片,则切片结果是不包含结束位置;如果使用索引名称进行切片,则切片结果是包含结束位置的。ser_obj[2:4]#使用位置索引进行切片ser_obj[c:e]#使用索引名称进行切片

3.索引操作如果希望获取的是不连续的数据,则可以通过不连续索引来实现。#通过不连续位置索引获取数据集ser_obj[[0,2,4]]#通过不连续索引名称获取数据集ser_obj[[a,c,d]]

3.索引操作布尔型索引同样适用于Pandas,具体的用法跟数组的用法一样,将布尔型的数组索引作为模板筛选数据,返回与模板中True位置对应的元素。#创建布尔型Series对象ser_bool=ser_obj2#获取结果为True的数据ser_obj[ser_bool]

3.索引操作DataFrame结构既包含行索引,也包含列索引。其中,行索引是通过index属性进行获取的,列索引是通过columns属性进行获取的。

3.索引操作虽然DataFrame操作索引能够满足基本数据查看请求,但是仍然不够灵活。为此,Pandas库中提供了操作索引的方法来访问数据,具体包括:loc:基于标签索引(索引名称),用于按标签选取数据。当执行切片操作时,既包含起始索引,也包含结束索引。iloc:基于位置索引(整数索引),用于按位置选取数据。当执行切片操作时,只包含起始索引,不包含结束索引。

谢谢

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档