重置索引.重置索引.ppt

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

重置索引教师:亢华爱北京信息职业技术学院商务数据分析与应用专业教学资源库

目录Contents对缺失的数据进行填充reindex()

1PARTreindex()

reindex()Pandas中提供了一个重要的方法是reindex(),该方法的作用是对原索引和新索引进行匹配,也就是说,新索引含有原索引的数据,而原索引数据按照新索引排序。如果新索引中没有原索引数据,那么程序不仅不会报错,而且会添加新的索引,并将值填充为NaN或者使用fill_vlues()填充其他值。

reindex()reindex()方法的语法格式如下:DataFrame.reindex(labels=None,index=None,columns=None,axis=None,method=None,copy=True,level=None,fill_value=nan,limit=None,tolerance=None)上述方法的部分参数含义如下:(1)index:用作索引的新序列。(2)method:插值填充方式。(3)fill_value:引入缺失值时使用的替代值。(4)limit:前向或者后向填充时的最大填充量。

reindex()为了能让大家更好地理解,接下来,通过一个简单的示例来演示重新索引的使用,(1)创建了一个ser.obj对象,并为其指定索引为“c、d、a、b、e”:importpandasaspdser_obj=pd.Series([1,2,3,4,5],index=[c,d,a,b,e])ser_obj

reindex()(2)重新索引,输入代码如下:ser_obj2=ser_obj.reindex([a,b,c,d,e,f])ser_obj2输出结果如图

2PART对缺失的数据进行填充

对缺失的数据进行填充注意:在上例中我们调用reindex()方法对索引重新排列,变为“a、b、c、d、e、f”,但由于索引“f”对应的值不存在,所以使用NaN对缺失的数据进行填充。

对缺失的数据进行填充如果不想填充为NaN,则可以使用fill_value参数来指定缺失值,具体示例代码如下。ser_obj2=ser_obj.reindex([a,b,c,d,e,f],fill_value=6)ser_obj2

对缺失的数据进行填充fill_value参数会让所有的缺失数据都填充为同一个值。如果期望使用相邻的元素值(前边或者后边元素的值)进行填充,则可以使用method参数。method参数对应的值有多个,上表列举了method参数可以使用的值。

对缺失的数据进行填充下面的示例代码演示了method参数的使用。代码如下:(1)创建Series对象,并为其指定索引ser_obj3=pd.Series([1,3,5,7],index=[0,2,4,6])ser_obj3(3)索引,后向填充值ser_obj3.reindex(range(6),method=ffill)(2)重新索引,前向填充值ser_obj3.reindex(range(6),method=ffill)

创建DataFrame类对象创建了一个ser_obj3对象,并为其指定索引为“0、2、4、6”,接着又调用reindex()方法对索引重新排列,变为“0、1、2、3、4、5”。当method参数的值设为“ffill”时,则表示会使用前一个索引对应的数据填充到缺失的位置。因此,索引“1”会填充索引“0”对应的数据“1”,索引“3”会填充索引“2”对应的数据“3”,依此类推。当method参数的值改为“bfill”时,则表示会使用后一个索引对应的数据填充到缺失的位置。因此,索引“1”会填充索引“2”对应的数据“3”,索引“3”会填充索引“4”对应的数据“5”,依此类推。

参考文献[1]黑马程序员.Python数据分析与应用:从数据获取到可视化.中国铁道出版社:2019.

谢谢教师:亢华爱北京信息职业技术学院商务数据分析与应用专业教学资源库

文档评论(0)

vermonth155-2娟 + 关注
实名认证
内容提供者

专注ppt课件

版权声明书
用户编号:8046135067000064

1亿VIP精品文档

相关文档