Python数据分析实践:数据拼接-1-new.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2022/3/144.8数据拼接-1In[]:importnumpyasnpimportpandasaspd4.8.1主键合并数据-merge方法为了方便维护,一般公司的数据在数据库内都是分表存储的,比如用一个表存储所有用户的基本信息,一个表存储用户的消费情况。所以,在日常的数据处理中,经常需要将两张表拼接使用,这样的操作对应到SQL中是join,在Pandas中则是用merge来实现。和数据库的join一样,merge函数也有左连接(left

2022/3/14 4.8 数据拼接-1 In [ ]: import numpy as np import pandas as pd 4.8.1 主键合并数据-merge方法 为了方便维护,一般公司的数据在数据库内都是分表存储的,比如用一个表存储所有用户的基本信息,一个表存储用户的消费情况。所以,在日常 的数据处理中,经常需要将两张表拼接使用,这样的操作对应到SQL中是join ,在Pandas中则是用merge来实现。 和数据库的join 一样,merge函数也有左连接(left)、右连接(right)、内连接(inner)和外连接(outer),但比起数据库SQL语言中的join 和 merge函数还有其自身独到之处,例如可以在合并过程中对数据集中的数据进行排序等。 merge是用来拼接两张表,那么拼接时自然就需要将信息一一对应地进行拼接,所以进行拼接的两张表需要有一个共同的识别信息的键(key)。 总结来说,整个merge的过程就是将信息一一对应匹配的过程,下面介绍merge的四种类型,分别为inner、left、right和outer。 1. 函数说明 pd.merge(left, right, how=inner, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort = False) concat函数本质上是在所有索引上同时进行对齐合并,而如果想在任意列上对齐合并,则需要merge函数,其在sql应用很多。 left,right : 两个要对齐合并的DataFrame; how : 先做笛卡尔积操作,然后按照要求,保留需要的,缺失的数据填充NaN; left: 以左DataFrame为基准,即左侧DataFrame的数据全部保留(不代表完全一致、可能会存在复制),保持原序; right: 以右DataFrame为基准,保持原序; inner: 交,保留左右DataFrame在on上完全一致的行,保持左DataFrame顺序; outer: 并,按照字典顺序重新排序; on :对应列名或者行索引的名字,如果要在DataFrame相同的列索引做对齐,用这个参数; left_on, right_on, left_index, right_index : on对应列名或者行索引的名字(所以行索引一般要跟列一样看待,有自己的名字),用这俩参数; index对应要使用的index,不建议使用,会搞晕。 sort: True or False ,是否按字典序重新排序。 file:///D:/Python39/envs/pydata/教材配套代码/模块四 数据处理Pandas/4.8 数据拼接-1.html 1/ 14 2022/3/14 4.8 数据拼接-1 一、inner merge的inner的类型称为内连接,它在拼接的过程中会取两张表的键(key)的交集进行拼接。什么意思呢?下面以图解的方式来一步一步拆解。 file:///D:/Python39/envs/pydata/教材配套代码/模块四 数据处理Pandas/4.8 数据拼接-1.html

文档评论(0)

ZuiFeng + 关注
实名认证
文档贡献者

分享文档,资源共享

1亿VIP精品文档

相关文档