- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据财务分析爱岗敬业诚实守信坚持准则提高技能廉洁自律客观公正参与管理强化服务
项目三数据清洗与处理任务四Python数据集成
爱岗敬业诚实守信merge()函数:具有表连接功能,类似于Excel中的vlookup()函数,可以根据一个多多个兼键(列值)将不同DataFrame连接起来。Merge()函数应用场景:两个DataFrame存在相同的键,根据键整合到一张表中,函数语法如下:pandas.merge(left,right,how=‘inner’,on=None,legt_on=None,right_on=Noneleft_index=False,right_index=False,sort=False,suffixes=(‘_x’,’_y’),conpy=True,indicator=False,validate=None)一、数据连接1.merge()函数
廉洁自律客观公正其参数:left、right:两个不同的DataFrameHow:连接方式,有inner,outer,left,right,默认为inner连接On:用于连接的列索引名称,左右两个DataFrame中必须同时存在,如果没有指定且left_index和right_index为False,则以两个DataFrame列名交集作为连接键。Left_on:左侧DataFrame中用于连接键的列名,该参数在左右列名不同但代表的含义相同时非常有用一、数据连接1.merge()函数
坚持准则提高技能Right_on:右侧DataFrame中用于连接键的列名。Left_index:默认False,设置为True代表使用左侧DataFrame中的行索引作为连接键Right_index:默认False,设置为True代表使用右侧DataFrame中的行索引作为连接键Sort:默认为False,是否将合并的数据进行排序,设置为False可以提高性能Suffixes:字符串组成的元组,两个表存在除主键之外的相同列名时,在列名后面附加的后缀名称用以区分数据源于哪个表,默认为(‘_x’,’_y’)。一、数据连接1.merge()函数
参与管理强化服务Copy:默认为True,设置为False,可以在某些特赦情况下避免将数据复制到结果数据结构中Indicator:默认为False,是否西安市每行数据的来源Validate:自动检查其合并键中是否有意外的重复项一、数据连接1.merge()函数
爱岗敬业诚实守信concat()函数:沿特定轴连接两个或两个以上的DataFrame,既可实现纵向合并,也可实现横向合并,行列索引均可重复。concat()函数适用场景:两个或多个DataFrame进行横向(列拼接)或纵向合并(行拼接)。函数语法如下:pandas.concat(objs,axis=0,join=‘outer’,ignore_index=False,keys=None,levels=None,names=None,verify_integrity=False,sort=None,copy=True)一、数据连接2.concat()函数
廉洁自律客观公正objs:连接对象axis:轴向,0代表纵向合并(行连接),1代表横向合并(列连接),默认为0Join:连接方式,有inner(交集)、outer(并集),默认为’outer’ignore_index:是否重建索引,默认为FalseKeys:传递键作为最外层级来构建层次结构索引,默认为NoneLevels:生成层次索引的级别,默认为None一、数据连接2.concat()函数
廉洁自律客观公正Names:生成层次索引的名称,默认为Noneverify_integrity:检测新的串联轴是是否包含重复项,默认为FalseSort:将合并的数据进行排序,设置为False可以提高性能,默认为TrueCopy:是否复制,默认为True一、数据连接2.concat()函数
坚持准则提高技能join()函数:连接另一个DataFrame的列(横向连接)。与merge()函数功能类似,区别在于两者适用的场景有所不同。join()函数适用场景:无重复列名的两个DataFrame基于行索引进行列拼接。函数语法如下:DataFrame.Join(other,on=None,how=‘left’,lsuffix=‘’,rsuffix=‘’,sort=False一、数据连接3.join()函数
参与管理强化服务参数如下:other:连接的DataFrameon:指定左表中用于连接的列名,右边必须有相同的列(需设置为索引)how:连接方式,有in
您可能关注的文档
- 大数据财务分析课件 1.1大数据认知.pptx
- 大数据财务分析课件 1.2财务大数据分析流程认知.pptx
- 大数据财务分析课件 2.1数据采集概述.pptx
- 大数据财务分析课件 2.2单表数据采集.pptx
- 大数据财务分析课件 2.3多表数据采集.pptx
- 大数据财务分析课件 3.1数据清洗概述.pptx
- 大数据财务分析课件 3.2Python 数据清洗.pptx
- 大数据财务分析课件 3.3数据集成.pptx
- 大数据财务分析课件 4.1数据可视化认知.pptx
- 大数据财务分析课件 4.2数据可视化常用图形认知.pptx
- 2025届安徽省舒城一中高三一诊考试英语试卷含解析.doc
- 广东省湛江市第二十一名校2023-2024学年高一下学期期中考试生物(选考)试卷.pdf
- 广东省湛江市第二十一名校2023-2024学年高一下学期期中考试生物(学考)试卷.docx
- 江苏省南通市合作盟校2025届高三压轴卷语文试卷含解析.doc
- 【权威】2025年高考第三次模拟考试 数学(新高考八省专用01 )(全解全析).docx
- 山东省菏泽市成武县全县联考2023-2024学年六年级下学期4月期中科学试题.docx
- 广东省湛江市第二十一名校2023-2024学年高一下学期期中考试生物(学考)试卷.pdf
- 2025届陕西省度西安中学高三下学期联考数学试题含解析.doc
- 河南省驻马店市2025届高考语文押题试卷含解析.doc
- 广东省湛江市雷州市第二名校2023-2024学年高一下学期生物期中试卷.docx
最近下载
- 初中历史跨学科教学模式探索与实践教学研究课题报告.docx
- 2025国家安全知识竞赛题库附答案(1-200题).docx
- 2023年保安员笔试考前题库500题(含答案).pdf VIP
- 西安市中招管理系统官网登陆入口http://222.91.162.190:81.doc
- 安全资料—13本台帐.doc VIP
- EHS管理-手册_原创精品文档.pdf VIP
- 尊重知识产权高中政治统编版选择性必修2法律与生活.pptx VIP
- QC∕T 29082-2019 汽车传动轴总成技术条件及台架试验方法.pdf
- 碳中和技术概论PPT完整全套教学课件.pptx
- 幼儿园玩教具装备采购 投标方案(技术标).doc VIP
文档评论(0)