轴向堆叠数据.轴向堆叠数据.ppt

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

轴向堆叠数据教师:亢华爱北京信息职业技术学院商务数据分析与应用专业教学资源库

目录Contents横向堆叠与外连接概述纵向堆叠与内连接

1PART概述

概述(1)axis:表示连接的轴向,可以为0或1,默认为0。(2)join:表示连接的方式,inner表示内连接,outer表示外连接,默认使用外连接。(3)ignore_index:接收布尔值,默认为False。如果设置为True,则表示清除现有索引并重置索引值。(4)keys:接收序列,表示添加最外层索引。(5)levels:用于构建Multilndex的特定级别(唯一值)。(6)names:在设置了keys和level参数后,用于创建分层级别的名称。(7)verify.integerity:检查新的连接轴是否包含重复项。接收布尔值,当设置为True时,如果有重复的轴将会抛出错误,默认为False。concat()函数可以沿着一条轴将多个对象进行堆叠,其使用方式类似数据库中的数据表合并,该函数的语法格式如下pandas.concat(objs,axis=0,join=outer,join_axes=None,ignore_index=False,keys=None,levels=None,names=None,verify_integrity=False,sort=None,copy=True)语法格式参数含义

根据轴方向的不同(axis参数)横向堆叠纵向堆叠堆叠数据默认采用的是外连接(join参数设为outer)的方式,当然也可以通过join=inner设置为内连接的方式AB外连接AB内连接A和B分别表示两个数据集当A与B采用外连接的方式合并时,所得的结果为索引并集部分的数据,数据不足的地方使用NaN补齐即可当A与B采用内连接的方式合并时,则所得的结果仅仅为索引交集(重叠)部分的数据概述我们将以横向堆叠与外连接、纵向堆叠与内连接为例,介绍如何使用concat()函数合并数据

2PART横向堆叠与外连接

横向堆叠与外连接当使用concat()函数合并时若是将axis参数的值设为1,且join参数的值设为outer,则说明使用横向堆叠与外连接的方式进行合并假设现在有两个表格分别为df1与df2它们采用横向堆叠、外连接的方式合并的效果如图所示

接下来,通过一段示例代码来演示如何通过concat()函数采用横向堆叠与外连接的方式合并数据,具体代码如下In[25]:importpandasaspddf1=pd.DataFrame({A:[A0,A0,Al],B:[B0,B0,Bl]})df2=pd.DataFrame({C:[C0,C0,Cl,C3],D:[D0,D2,D2,D3]})#横向堆叠合并dfl和df2,采用外连接的方式pd.concat([df1,df2],join=outer,axis=l)Out[25]:ABCD0 A0B0C0D01A0B0C0D22 A1B1C1D23 NaNNaNC3D3在上述示例中,创建了两个DataFrame类对象dfl与d£2,然后使用concat()函数合并这两个对象,由于这两个对象的列长度不相同,所以合并后会产生不存在的数据,这些数据会自动使用NaN进行填充横向堆叠与外连接

3PART纵向堆叠与内连接

纵向堆叠与内连接当使用concat()函数合并时若是将axis参数的值设为0,且join参数的值设为inner,则说明纵向堆叠与内连接的方式进行合并假设现在有两个表格分别为df1与df2它们采用纵向堆叠、内连接的方式合并的效果如图所示纵向堆叠示例

接下来,通过一段示例代码来演示如何通过concat。函数采用横向堆叠与外连接的方式合并数据,具体代码如下In[26]:importpandasaspddf1=pd.DataFrame({A:[A0,A1,A2],B:[B0,B1,B2],C:[C0,C1,C2]})df2=pd.DataFgme({B:[B3,B4,B5],C:[C3,C4,C5],D:[D3,D4,D5]})pd.concat([df1,df2],join=inner,axis=0)Out[26]:BC0B0C01B1C12B2C20B3C31B4

文档评论(0)

vermonth155-2娟 + 关注
实名认证
内容提供者

专注ppt课件

版权声明书
用户编号:8046135067000064

1亿VIP精品文档

相关文档