- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Python数据分析基础与应用模块5Pandas数据预处理
5.3Pandas数据抽取
5.3.1字段抽取字段抽取是根据已知列数据的开始和结束位置,抽取出新的数据。字段抽取采用slice()函数,该函数的语法格式如下:Series.str.slice(start=None,stop=None)函数参数说明如下:?start:表示字段抽取的开始位置。?stop:表示字段抽取的结束位置。
5.3.2字段拆分字段拆分是指按照约定规则拆分已有的字符串,字符分割函数有正序分割列split()函数和逆序分割列rsplit()函数。split()函数的语法格式如下:Series.str.split(sep=None,n=-1,expand=False)该函数参数说明如下:?sep:表示字符串中分隔字符的分隔符,默认分隔符为空格。?n:接收整数,默认值为-1,表示分割的列数。?expand:接收布尔值,默认值为False,表示返回序列(Series)或者索引(Index);如果值设置为True,则返回DataFrame对象或复杂索引(MultiIndex)。
5.3.3数据记录抽取数据记录抽取是指根据一定的条件,对数据记录进行抽取。记录抽取函数的语法格式如下:datafram[condition]函数返回值是DataFram。
5.3.3数据记录抽取函数参数condition为过滤条件,常用条件类型如下:①比较运算:大于()、小于()、大于等于(=)、小于等于(=)、不等于(!=)。②范围运算:between(left,right)。③空值匹配:pandas.isnull(column)。④字符匹配:str.contains(patten,na=False),其中na参数是指空值的处理方式,如果值设置为False,则不匹配空值。⑤逻辑运算:与(),或(|),取反(not)。
5.3.4日期转换与日期抽取Pandas处理日期和时间数据的方式有多种,其中日期转换、日期格式化和日期抽取是常见的3项功能。1.日期转换日期转换是指将字符型的日期格式的数据转换成为日期型数据。日期转换函数to_datetime()的语法格式如下:pandas.to_datetime(strDate,format,errors=raise)
5.3.4日期转换与日期抽取该函数参数说明如下:?strDate:表示字符型时间列;?format:表示日期时间格式符。?errors:取值范围为{ignore,raise,coerce},默认为raise。?如果取值为“raise”,则无效的数据将引发异常。?如果取值为“coerce”,则无效的数据将设置为NaN。?如果取值为“ignore”,则无效的数据将返回输入。
5.3.4日期转换与日期抽取2.日期格式化日期格式化是将日期时间型数据,按照指定格式,转为字符型数据。日期格式化函数的语法格式如下:df_dt.apply(lambdax:datetime.strftime(x,format))或df_dt.dt.strftime(format)该函数参数说明如下:?df_dt:表示数据集中日期时间列名。?format:表示时间日期格式符,如表5-2所示。
5.3.4日期转换与日期抽取3.日期抽取日期抽取是指从日期格式中抽取出需要的部分内容,日期抽取语法格式如下:df_dt.dt.property该函数参数说明如下:?df_dt:表示数据集中日期时间列名。?property:表示时间属性。
快乐学习高效学习祝学习进步!
您可能关注的文档
- Python数据分析基础与应用(微课版) 教案 模块7 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块9 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块8 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块5 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块6 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块4 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块1 认知数据分析与构建程序运行环境电子教案.docx
- Python数据分析基础与应用(微课版) 教案 模块1 应用与实战.docx
- Python数据分析基础与应用(微课版) 教案 模块3 数据分析应用NumPy.docx
- Python数据分析基础与应用(微课版) 教案 模块7 数据分析可视化展示.docx
- Python数据分析基础与应用(微课版)课件 5.4 Pandas数据重塑.pptx
- Python数据分析基础与应用(微课版)课件 6.3 Pandas数据聚合与分组运算.pptx
- Python数据分析基础与应用(微课版)课件 7.2 应用Pyplot子模块的函数绘制图形.pptx
- Python数据分析基础与应用(微课版)课件 7.3 使用Pandas的plot方法绘制图形.pptx
- Python数据分析基础与应用(微课版)课件 7.4 使用Seaborn库绘制统计图表.pptx
- Python数据分析基础与应用(微课版)课件 7.5 使用pyecharts库实现数据可视化.pptx
- Python数据分析基础与应用(微课版)课件 8.1 Pandas时间生成与转换.pptx
- Python数据分析基础与应用(微课版)课件 模块9 数据分析与可视化综合实战.pptx
- Python数据分析基础与应用(微课版)课件 8.3 Pandas数据重采样.pptx
- Python数据分析基础与应用(微课版)课件 8.2 Pandas随机抽样.pptx
最近下载
- T_CECA20011-2021:含铁含锰地下水接触氧化法给水处理技术规程.pdf VIP
- 事故应急技术第一章 应急管理概论课件.ppt VIP
- 包括乘用车项目风险管理分析报告(仅供参考).docx VIP
- 高中物理必修2机械能守恒练习题.pdf VIP
- BS EN 573-3-2019 铝和铝合金.锻制产品的化学成分和形式.第3部分:产品的化学成分和形 式.pdf VIP
- 学堂在线 高技术与现代局部战争 章节测试答案.docx VIP
- 风光储电站成本构成全套.docx VIP
- 数字信号处理(英文版)教学课件.ppt VIP
- 白话机器学习算法.pdf VIP
- 职业技术学院网络营销与直播电商专业人才培养方案(2024版).pdf VIP
文档评论(0)