第03课 更新版-pandas.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
pandas入门培训 讲师 :林应 微博 :http ///u/2607195824 最后更新 :2016/09/03 pandas简介 • 官网链接 :http // / • pandas = pannel data + data analysis • 简介 :Pandas是python的一个数据分析包 ,最初由AQR Capital Management于2008年4月开发 ,并于2009年底开源出来 ,目前由专注于 Python数据包开发的PyData开发team继续开发和维护 ,属于PyData项 目的 一部分。Pandas最初被作为金融数据分析工具而开发出来 ,因此 ,pandas为 时间序列分析提供了很好的支持。 • 作者介绍 :Wes McKinney 基本功能 • 开发pandas时提出的需求 • 具备按轴 自动或显式数据对齐功能的数据结构 • 集成时间序列功能 • 既能处理时间序列数据也能处理非时间序列数据的数据结构 • 数学运算和约简 (比如对某个轴求和 )可以根据不同的元数据 (轴编号 )执行 • 灵活处理缺失数据 • 合并及其他出现在常见数据库 (例如基于SQL的 )中的关系型运算 数据结构 Series • Series是一种类似于一维数组的对象 ,它由一组数据 (各种NumPy数据类型 ) 以及一组与之相关的数据标签 (即索引 )组成。 • Series的字符串表现形式为 :索引在左边 ,值在右边。 • 创建 • 读写 • 运算 • 例子代码分析 :introduction_to_pandas_data_structures/series.py 数据结构 DataFrame • DataFrame是一个表格型的数据结构 ,它含有一组有序的列 ,每列可以是不同 的值类型 (数值、字符串、布尔值等 )。 • DataFrame既有行索引也有列索引 ,它可以被看做由Series组成的字典 (共用 同一个索引 )。 数据结构 DataFrame • 可以输入给DataFrame构造器的数据 类型 说明 二维ndarray 数据矩阵 ,还可以传入行标和列标。 由数组、列表或元组组成的字典 每个序列会变成DataFrame的一列 ,所有序列的长度必须相同。 NumPy的结构化/记录数组 类似于 “由数组组成的字典” 由Series组成的字典 每个Series会组成一列。如果没有显示指定索引 ,则各Series的索引会被合并成结果的 行索引。 由字典组成的字典 各内层字典会成为一列。键会被合并成结果的行索引 ,跟 “由Series组成的字典”的情 况一样。 字典或Series的列表 各项将会成为DataFrame的一行。字典键或Series索引的并集将会成为DataFrame的列 标。 由列表或元组组成的列表 类似于 “二维ndarray” 另一个DataFrame 该DataFrame的索引将会被沿用 ,除非显示指定了其他索引。 NumPy的MaskedArray 类似于 “二维ndarray”的情况 ,只是掩码值在结果DataFrame会变成NA/缺失值。 数据结构 DataFrame • 创建 • 读写 • 例子代码 :introduction_to_pandas_data_structures/dataframe.py 数据结构 索引对象 • pandas的索引对象负责管理轴标签和其他元数据 (比如轴名称等 )。构建 Series或DataFrame时 ,所用到的任何数组或其他序列的标签都会被转换成一 个Index。 • Index对象是不可修改的 (immutable ),因此用户不能对其进行修改。不可 修改性非常重要 ,因为这样才能使Index对象在多个数据结构之间安全共享。 • 例子代码 :introduct

文档评论(0)

139****6621 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档