人民大2024付东普《数据采集与处理:基于python》PPT第3章-Numpy与Pandas基础.pptx

人民大2024付东普《数据采集与处理:基于python》PPT第3章-Numpy与Pandas基础.pptx

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第三章

numpy与pandas基础《数据采集与处理:基于Python》付东普管理工程学院电子邮箱:fudongpu@2024/5/111

2024/5/112教学目标本章学习目标1.了解numpy和pandas的常用数据结构、数据类型及其用途;2.掌握numpy多维数组的创建、存取、运算及数组间的合并、拆分等常见操作;3.理解pandas中Series和DataFrame的特点及与numpy多维数组的区别,掌握它们的创建、存取、运算等常用操作方法。本章提纲1、numpy基础2、pandas基础

numpy基础2024/5/113

为什么选择numpyPython自身的嵌套列表结构(nestedliststructure)的运行和存储效率较低,不能适应大规模的数值计算、元素操作及矩阵运算等。而numpy模块则比嵌套列表高效得多,并且支持大量的多维数组与矩阵运算,针对数组运算还提供了大量的数学函数库。numpy(即numericPython)的前身为Numeric,最早由JimHugunin与其他协作者共同开发。2005年,TravisOliphant在Numeric中结合了另一个同性质的程序库numarray的特色,并加入了其他扩展,从而开发了numpy。numpy开放源代码,并且由许多协作者共同维护开发。numpy专为严格的数字处理而生,提供了许多高级的数值编程工具,如矩阵数据类型、矢量处理以及精密的运算库。numpy多为大型金融公司使用,一些核心的科学计算组织(如LawrenceLivermore、NASA)也用其处理本来使用C、Fortran或Matlab等完成的任务。numpy模块库包括一个强大的n维数组对象array,比较成熟的函数库,用于整合C/C和Fortran代码的工具包,实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用会更加方便。2024/5/114

numpy数据类型numpy支持的数据类型比Python内置的数据类型多,基本上可以和C语言的数据类型对应,其中部分类型对应Python内置的数据类型。numpy的数值类型实际上是dtype对象的实例,并对应唯一的字符,包括np.bool_,32,np.float32等。表3-1列举了常用的numpy数据类型。numpy提供了两种基本对象:ndarray(n-dimensionalarrayobject)和ufunc(universalfunctionobject)。ndarray(下文统一称为数组)是存储单一数据类型的多维数组,而ufunc则是能够对数组进行处理的函数。2024/5/115名称描述bool_布尔类型(True或者False)int_默认的整数类型(类似于C语言中的long、int32或int64)intc与C语言的int类型一样,一般是int32或int64intp用于索引的整数类型(类似于C语言中的ssize_t,一般情况下仍然是int32或int64)int8字节(-128~127)int16整数(-32768~32767)int32整数(-2147483648~2147483647)int64整数(-9223372036854775808~9223372036854775807)uint8无符号整数(0~255)uint16无符号整数(0~65535)uint32无符号整数(0~4294967295)uint64无符号整数(0~18446744073709551615)float_float64类型的简写float16半精度浮点数,包括1个符号位、5个指数位、10个尾数位float32单精度浮点数,包括1个符号位、8个指数位、23个尾数位名称描述float64双精度浮点数,包括1个符号位、11个指数位、52个尾数位complex_complex128类型的简写,即128位复数complex64复数,表示双32位浮点数(实数部分和虚数部分)complex128复数,表示双64位浮点数(实数部分和虚数部分)

数据类型ndarray1.ndarray简介numpy提供了一个n维数组类型ndarray,它描述了相同类型的items的集合,如图3-1所示。2024/5/116

数据类型ndarrayndarray与原生Python列表有很大区别。首先,如图3-1所示,ndarray在存储数据时,数据与数据的地址都是连续的,这样就使得批量操作数组元素时的速度更快。这是因为ndarray中所有元素的类型都是相同的,而Python列表中的元素类型是任意的,所以ndarray在存储元素时内存可以连续,而原生Python列表只能

文档评论(0)

allen734901 + 关注
实名认证
内容提供者

知识共享

1亿VIP精品文档

相关文档