- 1、本文档共96页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Python数据分析
项目三Python数据分析库训练;知识引入;知识框架;目录;pandas有两个基本的数据结构:Series和DataFrame。本任务主要讲解这两个数据结构的创建和基本使用。;Series数据结构类似于一维数组,但它是由一组数据(各种NumPy数据类型)和一组对应的索引组成的。;Series数据:索引在左边,值在右边。如果没有指定一组数据作为索引的话,Series数据会以0到N-1(N为数据的长度)作为索引,也可以通过指定索引的方式来创建Series数据。;Series有values和index属性,可返回值数据的数组形式和索引对象。;DataFrame数据是Python数据分析最常用的数据,类似于Excel表格型数据。
创建DataFrame数据的办法有很多,最常用的是传入由数组、列表或元组组成的字典。;可以通过columns指定列索引的排列顺序。
当没有指定行索引的情况下,会使用0到N-1(N为数据的长度)作为行索引,这里也可以使用其他数据作为行索引。;下表中提供了部分常用的为创建DataFrame数据可传入的数据类型。;通过values属性可以将DataFrame数据转换为二维数组。;Series的索引和DataFrame的行和列索引都是索引对象,用于负责管理轴标签和元数据。;索引对象是不可以进行修改的,如果修改就会报错。
索引对象类似于数组数据,其功能也类似于一个固定大小的集合。;1、创建Series,要求包含4个元素
2、根据给定字典,创建DataFrame;目录;本任务将针对Series和DataFrame数据,讲解Series和DataFrame重新索引和更换索引的操作方法、Series和DataFrame数据结构的索引和选取,以及针对DataFrame数据结构进行数据的编辑操作(包括增、删、改)。;这里所说的重新索引并不是给索引重新命名,而是对索引重新排序,如果某个索引值不存在的话,就会引入缺失值(NaN)。;如果需要对插入的缺失值进行填充的话,可通过method参数来实现,参数值为ffill或pad时为向前填充,参数值为bfill或backfill时为向后填充。;对于DataFrame数据来说,行和列索引都是可以重新索引的。;下表为reindex函数的各参数使用说明。;在DataFrame数据中,如果不希望使用默认行索引的话,可在创建的时候通过index参数来设置行索引。有时我们希望将列数据作为行索引,这时可以通过set_index方法来实现。;与set_index方法相反的方法是reset_index(恢复索引)方法。;对DataFrame数据,排序之后其行索引会改变。;恢复索引的用法如下,原索引可通过drop参数进行删除。;1、创建Series,并重建该Series的索引
2、创建DataFrame数据,并更换该DataFrame索引
3、对DataFrame进行恢复索引操作;在pandas数据中,需要通过索引来完成数据的选取工作。Series数据的选取较为简单,使用方法类似于Python的列表,这里不仅可以通过0到N-1(N是数据长度)来进行索引,同时也可以通过设置好的索引标签来进行索引。;;;;;;;;1、根据给定数据创建DafaFrame
2、选取DataFrame中的第2行和第3行数据;;;;;;1、根据给定数据创建DafaFrame,并增加一行数据
2、在DataFrame中增加一列数据
3、从DataFrame中删除一行数据;目录;本任务将针对Series和DataFrame数据,详细讲解二者的算术运算和函数的应用,这在数据分析中会经常使用。;pandas的数据对象在进行算术运算时,如果有相同索引对则进行算术运算,如果没有则会引入缺失值,这就是数据对齐。;;;;;;;;;;;;;1、完成Series的数据运算
2、完成DataFrame的数据运算;目录;层次化索引是pandas重要的功能之一,本任务将简单讲解层次化索引的创建过程和使用方法。;简单地说,层次化索引就是轴上有多个级别索引。下面例子为创建一个层次化索引的Series对象。;层次化索引的对象,索引和选取操作都很简单。;对于DataFrame数据而言,行和列索引都可以为层次化索引。;通过swaplevel方法可以对层次化索引进行重排。;在对层次化索引的pandas数据进行汇总统计时,可以通过level参数指定在某层次上进行汇总统计。;1、完成Series层次化索引的创建
2、完成DataFrame层次化索引的创建;目录;pandas库中集成了matplotlib中的基础组件,让绘图更加简单。本节将讲解如何利用pandas绘制基本图形。;;;;;pandas库中的Serie
您可能关注的文档
- 《Python数据分析》课程标准.docx
- 《Python数据分析》课程标准.pdf
- 《Python数据分析》课件 项目二 Python科学计算库训练.pptx
- 《Python数据分析》课件 项目六 机器学习.pptx
- 《Python数据分析》课件 项目四 Python大数据分析基础综合应用.pptx
- 居间方2024年技术转让合同3篇.docx
- 居间方2024年技术转让合同3篇.docx
- 居间服务合同官方(2024版).docx
- 中国地线钳行业市场发展前景及发展趋势与投资战略研究报告(2024-2030).docx
- 中国松香黄板材行业市场发展前景及发展趋势与投资战略研究报告(2024-2030).docx
文档评论(0)