- 1、本文档共56页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Python科学计算、数据处理与数据分析;第3章Pandas基础;第2章NumPy基础;NumPy虽然提供了方便的数组功能,但是它缺少数据处理和数据分析的快速工具。Pandas是基于NumPy的一种工具,这个工具是为了解决数据处理、数据分析任务而创建的,它包含的数据结构和数据处理工具使得用户在Python中进行数据处理和数据分析非常快捷
在本书后续内容中,我们会使用如下的方式导入Pandas。
importPandasaspd
;学习Pandas,需要了解Series和DataFrame,它们是Pandas中最常用的两个数据结构对象。
3.1.1Series对象
Series是一种一维的数组型对象,它除了包含值序列外(与NumPy中的一维ndarry类型相似),还包含数据标签,后面我们称其为索引(index)。;Series对象与NumPy中的一维数组类似,二者与Python基本的数据结构List也很相近。它们的区别如下。
①List中的元素可以是不同的数据类型,而NumPy中的一维数组和
Series对象则只允许存储相同数据类型的元素,这样可以更有效地使用内存,提高运算效率。
②Series对象与NumPy中的一维数组的不同之处是Series对象除了有值序列外,还有数据标签,而NumPy中的数组没有数据标签。
③Series对象中的数据必须是一维的,而NumPy中的数组可以是多维的。
④Series对象定义了NumPy中的ndarray数组的接口_array_(),因此NumPy函数可以直接操作Series对象。;Series对象不仅存储值序列,而且存储数据标签,因此每个Series对象都具有两个属性。
①index属性:RangeIndex索引对象,如果创建Series对象时不指定index属性,那么系统会默认生成,默认生成的索引是从0到N-1(N是数据长度)。
②values属性:保存元素值的ndarray数组,NumPy函数都是对此进行操作。;最简单的Series对象可以仅由一个列表生成
ser=pd.Series([1,2,3])(未指定索引)
ser1=pd.Series([1,2,3,4,5],index=[‘a’,‘b’,‘c’,‘d’,‘e’])(指定索引)
除了从列表创建Series对象,还可以从字典、NumPy的ndarray数组、range()函数等创建Series对象。
【实例】从字典创建Series对象(不指定index属性)。
In[5]:dictSer=pd.Series({a:11,b:12,c:13,d:14,e:15,f:16})从字典创建Series对象时,如果不指定index属性,那么Series对象的index属性默认是字典的键
;【实例】从字典创建Series对象并指明index属性,且index属性是字典键中的部分值。
In[6]:dictSer=pd.Series({a:10,b:40,c:5,d:90,e:35,f:40},index=[a,b,e])
从字典生成Series对象,并且在Series对象中设置index属性时,如果index属性是字典中的部分键值,就相当于从字典中挑选数据。
;【实例】从字典创建Series对象并指明index属性,且index属性中存在部分标签不在字典的键中。
In[7]:dictSer=pd.Series({a:10,b:40,c:5,d:90,e:35,f:40},index=[a,b,e,k])
index属性中的标签k没有出现在字典的键中,它对应的值是NaN,这是Pandas中标记缺失值的方式。除此之外,因为字典键c并没有出现在索引中,所以它被排除在输出结果之外。
;【实例】从ndarray数组创建Series对象。
In[8]:arr1=np.array([11,12,13,14,15])
arr2=np.array([a,b,c,d,e])
serp=pd.Series(arr1,index=arr2)
Series对象定义了NumPy的ndarray数组的接口_array_(),因此NumPy函数可以直接操作Series对象。例如,使用布尔值数组进行过滤,与标量进行算术运算,或是应用数学函数,并且这些操作都会保存index属性的值连接。
In[9]:arr1[serp12]
In[10]:serp*2
In[11]:np.exp(serp)
;对于很多应用来说,在数学运算中自动对齐index属性是Series对象的一个非常有用的特性。
;Series对象本身和其索引对象都有name属性,这个特性与Pandas的其他功能集成在一起,所以一定要掌握它的name属性。
您可能关注的文档
- Python科学计算、数据处理与分析课件 (1).pptx
- Python科学计算、数据处理与分析课件 (5).pptx
- Python科学计算、数据处理与分析课件 (6).pptx
- Python科学计算、数据处理与分析课件 (7).pptx
- Python科学计算、数据处理与分析课件 (8).pptx
- 项目八 商品销售沟通.doc
- 项目十二 投诉处理沟通教案(4课时).doc
- 项目十一 客户服务沟通(4课时).doc
- 第七章-Web服务与微服务.ppt
- 第四章-Web开发模式与框架.ppt
- 当代国际政治与经济 复习课件-政治一轮复习统编版选择性必修一.pptx
- 4.2 挑战与应对课件高中政治统编版选择性必修一当代国际政治与经济.pptx
- 第二课 中国共产党的先进性 课件-高中政治必修3政治与法治.pptx
- 第六课 实现人生的价值 课件高考政治一轮复习统编版必修四哲学与文化.pptx
- 专题04 全面依法治国 课件高考政治一轮复习统编版必修三政治与法治.pptx
- 4.2我国的社会保障课件-高中政治统编版必修二经济与社会.pptx
- 3.1贯彻新发展理念 课件高中政治统编版必修二经济与社会_1.pptx
- 第八课 把握辩证分合 课件-高考政治一轮复习统编版选择性必修三逻辑与思维_2.pptx
- 第七课 学会归纳与类比推理 课件高考政治一轮复习统编版选择性必修三逻辑与思维.pptx
- 第一单元 树立科学思维观念 课件高考政治一轮复习统编版选择性必修三逻辑与思维_1.pptx
最近下载
- 超星学习通 群芳谱-《红楼梦》中的女性形象鉴赏(长安大学)尔雅网课答案.pdf
- 2024年民主生活会个人对照检查材料3篇范文.docx VIP
- 《抽样检验培训教材》PPT课件.ppt VIP
- 2021高考作文写作素材:世界八大哲学家的名言+事例.docx
- 《证券投资理论与实务》教学资料:教案资料汇总.doc VIP
- 十进制加减可逆计数器的设计.pdf
- 华为手机结构件可靠性测试方法和要求.pdf
- 机械振动与冲击人体暴露于全身振动的评价第1部分一般要求GBT134411-2007.doc
- 橡胶胶管、硅胶密封圈、橡胶垫片生产项目环境影响报告表.pdf
- 小学英语四年级下册课本知识点(外研版三年级起点).pdf
文档评论(0)