- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
pandas入门培训
讲师 :林应
微博 :http ///u/2607195824
最后更新 :2016/09/03
pandas简介
• 官网链接 :http // /
• pandas = pannel data + data analysis
• 简介 :Pandas是python的一个数据分析包 ,最初由AQR Capital
Management于2008年4月开发 ,并于2009年底开源出来 ,目前由专注于
Python数据包开发的PyData开发team继续开发和维护 ,属于PyData项 目的
一部分。Pandas最初被作为金融数据分析工具而开发出来 ,因此 ,pandas为
时间序列分析提供了很好的支持。
• 作者介绍 :Wes McKinney
基本功能
• 开发pandas时提出的需求
• 具备按轴 自动或显式数据对齐功能的数据结构
• 集成时间序列功能
• 既能处理时间序列数据也能处理非时间序列数据的数据结构
• 数学运算和约简 (比如对某个轴求和 )可以根据不同的元数据 (轴编号 )执行
• 灵活处理缺失数据
• 合并及其他出现在常见数据库 (例如基于SQL的 )中的关系型运算
数据结构 Series
• Series是一种类似于一维数组的对象 ,它由一组数据 (各种NumPy数据类型 )
以及一组与之相关的数据标签 (即索引 )组成。
• Series的字符串表现形式为 :索引在左边 ,值在右边。
• 创建
• 读写
• 运算
• 例子代码分析 :introduction_to_pandas_data_structures/series.py
数据结构 DataFrame
• DataFrame是一个表格型的数据结构 ,它含有一组有序的列 ,每列可以是不同
的值类型 (数值、字符串、布尔值等 )。
• DataFrame既有行索引也有列索引 ,它可以被看做由Series组成的字典 (共用
同一个索引 )。
数据结构 DataFrame
• 可以输入给DataFrame构造器的数据
类型 说明
二维ndarray 数据矩阵 ,还可以传入行标和列标。
由数组、列表或元组组成的字典 每个序列会变成DataFrame的一列 ,所有序列的长度必须相同。
NumPy的结构化/记录数组 类似于 “由数组组成的字典”
由Series组成的字典 每个Series会组成一列。如果没有显示指定索引 ,则各Series的索引会被合并成结果的
行索引。
由字典组成的字典 各内层字典会成为一列。键会被合并成结果的行索引 ,跟 “由Series组成的字典”的情
况一样。
字典或Series的列表 各项将会成为DataFrame的一行。字典键或Series索引的并集将会成为DataFrame的列
标。
由列表或元组组成的列表 类似于 “二维ndarray”
另一个DataFrame 该DataFrame的索引将会被沿用 ,除非显示指定了其他索引。
NumPy的MaskedArray 类似于 “二维ndarray”的情况 ,只是掩码值在结果DataFrame会变成NA/缺失值。
数据结构 DataFrame
• 创建
• 读写
• 例子代码 :introduction_to_pandas_data_structures/dataframe.py
数据结构 索引对象
• pandas的索引对象负责管理轴标签和其他元数据 (比如轴名称等 )。构建
Series或DataFrame时 ,所用到的任何数组或其他序列的标签都会被转换成一
个Index。
• Index对象是不可修改的 (immutable ),因此用户不能对其进行修改。不可
修改性非常重要 ,因为这样才能使Index对象在多个数据结构之间安全共享。
• 例子代码 :introduct
文档评论(0)