- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2022/3/144.8数据拼接-1In[]:importnumpyasnpimportpandasaspd4.8.1主键合并数据-merge方法为了方便维护,一般公司的数据在数据库内都是分表存储的,比如用一个表存储所有用户的基本信息,一个表存储用户的消费情况。所以,在日常的数据处理中,经常需要将两张表拼接使用,这样的操作对应到SQL中是join,在Pandas中则是用merge来实现。和数据库的join一样,merge函数也有左连接(left
2022/3/14 4.8 数据拼接-1
In [ ]: import numpy as np
import pandas as pd
4.8.1 主键合并数据-merge方法
为了方便维护,一般公司的数据在数据库内都是分表存储的,比如用一个表存储所有用户的基本信息,一个表存储用户的消费情况。所以,在日常
的数据处理中,经常需要将两张表拼接使用,这样的操作对应到SQL中是join ,在Pandas中则是用merge来实现。
和数据库的join 一样,merge函数也有左连接(left)、右连接(right)、内连接(inner)和外连接(outer),但比起数据库SQL语言中的join 和
merge函数还有其自身独到之处,例如可以在合并过程中对数据集中的数据进行排序等。
merge是用来拼接两张表,那么拼接时自然就需要将信息一一对应地进行拼接,所以进行拼接的两张表需要有一个共同的识别信息的键(key)。
总结来说,整个merge的过程就是将信息一一对应匹配的过程,下面介绍merge的四种类型,分别为inner、left、right和outer。
1. 函数说明
pd.merge(left, right, how=inner, on=None, left_on=None, right_on=None, left_index=False,
right_index=False, sort = False)
concat函数本质上是在所有索引上同时进行对齐合并,而如果想在任意列上对齐合并,则需要merge函数,其在sql应用很多。
left,right : 两个要对齐合并的DataFrame;
how : 先做笛卡尔积操作,然后按照要求,保留需要的,缺失的数据填充NaN;
left: 以左DataFrame为基准,即左侧DataFrame的数据全部保留(不代表完全一致、可能会存在复制),保持原序;
right: 以右DataFrame为基准,保持原序;
inner: 交,保留左右DataFrame在on上完全一致的行,保持左DataFrame顺序;
outer: 并,按照字典顺序重新排序;
on :对应列名或者行索引的名字,如果要在DataFrame相同的列索引做对齐,用这个参数;
left_on, right_on, left_index, right_index :
on对应列名或者行索引的名字(所以行索引一般要跟列一样看待,有自己的名字),用这俩参数;
index对应要使用的index,不建议使用,会搞晕。
sort: True or False ,是否按字典序重新排序。
file:///D:/Python39/envs/pydata/教材配套代码/模块四 数据处理Pandas/4.8 数据拼接-1.html 1/ 14
2022/3/14 4.8 数据拼接-1
一、inner
merge的inner的类型称为内连接,它在拼接的过程中会取两张表的键(key)的交集进行拼接。什么意思呢?下面以图解的方式来一步一步拆解。
file:///D:/Python39/envs/pydata/教材配套代码/模块四 数据处理Pandas/4.8 数据拼接-1.html
您可能关注的文档
- 洗衣机控制电路工作原理分析课件.pptx
- 洗衣机控制电路故障检测与维修课件.pptx
- 遥控风扇主机电路工作原理分析课件.pptx
- 正反可调速流水灯电路元器件识读课件.pptx
- Python程序设计:AES数据加密.pptx
- Python程序设计:AES数据解密.pptx
- Python程序设计:base64解码.pptx
- Python程序设计:break语句、continue语句.pptx
- Python程序设计:DDOS攻击的实现.pptx
- Python程序设计:for循环.pptx
- 2026年新疆师范大学辅导员招聘备考题库最新.docx
- 2026年上海立达学院辅导员招聘备考题库最新.docx
- 2025年长城铝业公司职工工学院辅导员招聘备考题库附答案.docx
- 2025年重庆应用技术职业学院辅导员考试笔试真题汇编附答案.docx
- 2025年香港中文大学(深圳)辅导员招聘考试真题汇编最新.docx
- 2025年闽南科技学院辅导员考试笔试真题汇编附答案.docx
- 2025年青岛大学辅导员招聘考试真题汇编附答案.docx
- 2025年长春早期教育职业学院辅导员考试笔试真题汇编最新.docx
- 2026年东北农业大学辅导员招聘备考题库最新.docx
- 2025年陕西学前师范学院辅导员考试笔试题库最新.docx
最近下载
- 康复医学发展史.ppt VIP
- 第十八章 电功率(单元测试)(含答案)2025-2026学年物理人教版九年级全一册.docx
- NBT 20039.11-2011 核空气和气体处理规范通风、空调与空气净化 第11部分:碘吸附器(Ⅰ型).pdf VIP
- 《监理规划 .doc VIP
- 国家开放大学《国际经济法》形考任务1-4参考答案 .pdf VIP
- 郭巍《硕博研究生英语综合教程》Unit 5.pptx VIP
- 毕业设计---基于plc的门禁系统设计.doc VIP
- 上海进才中学2021-2022学年高二下学期期末英语试卷(解析版).docx VIP
- 《我国康复事业发展概况》课件.ppt VIP
- 2025至2030保险行业发展研究与产业战略规划分析评估报告.docx VIP
原创力文档


文档评论(0)