- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
任务1NumPy数据处理和分析
任务2Pandas数据处理和分析;任务1NumPy数据处理和分析;使用NumPy实现学生成绩数据统计、数据处理以及分析,要求实现所有学生语文、数学、英语成绩的分析,并取得其平均成绩、最低成绩、最高成绩、方差、标准差。然后将这些学生的总成绩排序输出。此操作过程可分为三个步骤去实现,主要内容如下:
(1)安装NumPy,并引入NumPy的库文件。
(2)定义一个数组,统计全班学生的成绩。
(3)调用NumPy当中的库函数,实现对数据的统计和处理。
一、NumPy简介及安装
NumPy的全称是NumericalPython,它是Python语言的一个扩展程序库,支持大量的维度数;组与矩阵运算,并针对数组运算提供大量的数学函数库。NumPy的图标如图2-1所示。
NumPy的前身为Numeric,最早由JimHugunin与其他协作者共同开发。2005年,TravisOliphant在Numeric中增加了一个同性质的程序库Numarray,并加入了独有的特点,由此开发了NumPy。NumPy不仅开放源代码,而且由许多协作者共同维护开发。
Python不提供数组功能。列表虽然可以完成基本的数组功能,但不能保证在数据量较大时高速读取数据。为此,NumPy提供了真正的数组功能,以及能够进行数据快速处理的多种函数,并且NumPy内置函数处理数据的速度是C语言级别的,因此在编写程序的时候,应当尽量使用内置函数,避免出现效率瓶颈现象。
;NumPy具有许多显著的特征,在这些特征的帮助下,NumPy成为速度最快和功能强大的数学计算库。NumPy的常见特性如下所示。
(1)具有一个强大的N维数组对象ndarray。
(2)支持广播功能函数。
(3)整合C/C++/Fortran代码的工具。
(4)支持线性代数、傅里叶变换、随机数生成等功能。
NumPy属于Python的第三方框架,可以使用pip安装、wheel安装和源码安装等安装方式。使用pip安装NumPy的步骤如下所示。
第一步:在Windows中,NumPy安装与普通的第三方库安装一样,可以通过Python的包管理工具pip安装,命令如下所示。;第二步:安装完成后,可以使用简单的Python代码进行测试,代码如下所示。
效果如图2-2所示。
二、ndarray对象
ndarray对象是NumPy最重要的特性。ndarray对象是一系列同类型数据的集合,集合中元素的???引从0开始,并且ndarray中存放的每个元素在内存中都有相同大小的存储空间。
ndarray对象由指针对象、数据类型、表示数组形状的元组和跨度元组四个模块组成。
(1)指针对象,即指向数据,也可以说是指向内存或内存映射文件中的一块数据。
;(2)数据类型,即dtype,包括np.int32、np.float32等。
(3)表示数组形状的元组,表示各维度大小的元组,比如arr[3][3]就是一个二维数组。
(4)跨度元组,即stride,其中的整数指的是为了前进到当前维度下一个元素需要“跨过”的字节数。这里的跨度可以取负值。
在NumPy中创建ndarray,需要调用array()函数来实现。该方法接受列表格式的参数后即可返回一个包含参数内容的ndarray对象,代码如下所示。
效果如图2-3所示。;在NumPy中,每一个线性的数组称为一个轴(axis),也就是维度(dimension)。二维数组本质上是以数组作为数组元素的数组,每个元素是一个一维数组。所以,一维数组就是NumPy中的轴(axis),第一个轴相当于底层数组,第二个轴是底层数组里的数组。通常可以对axis进行声明。axis=0,表示沿着第0轴进行操作,即对每一列进行操作;axis=1,表示沿着第1轴进行操作,即对每一行进行操作。除了数组的维度和秩,还有一些常见的信息可通过ndarray提供的属性进行查询。NumPy的数组的常用属性如表2-1所示。
下面使用ndarray.ndim获取数组a的维度,代码如下所示。
效果如图2-4所示。;三、NumPy数组创建
NumPy创建数组时,除了使用array()方法外,还可以使用empty()、zeros()、ones()等方法。详细说明如表2-2所示。
语法格式如下所示。;下面分别使用empty()、zeros()、ones()进行数组的创建,代码如下所示。
结果如图2-5所示。;四、NumPy数组操作
在数据采集与分析的过程中,数据的处理尤为重要,比如数据筛选过滤、数据变换、数据去重等操作都必须以数组的操作为基础。
在NumPy当中包含了许多函数,用来支持数组的操作,这些操作大致可以分为修改数组形状、翻转数组、修改数组维度、连接数组、分割数组
您可能关注的文档
- 质量法律法规(第2版) 教案 第三章 标准化法.doc
- 质量法律法规(第2版) 教案 第十章 消费者权益保护法.doc
- 质量法律法规(第2版) 教案 第四章 计量法.doc
- 质量法律法规(第2版) 教案 第一章 法学基础理论 (2).doc
- 质量法律法规(第2版) 教案 第一章 法学基础理论.doc
- 人工智能采集和分析基础(Python版)课件 学习单元六 Matplotlib可视化数据分析.pptx
- 人工智能采集和分析基础(Python版)课件 学习单元三 Requests网页访问.pptx
- 人工智能采集和分析基础(Python版)课件 学习单元四 XPath和re内容解析.pptx
- 人工智能采集和分析基础(Python版)课件 学习单元五 Scrapy网页数据采集.pptx
- 人工智能采集和分析基础(Python版)课件 学习单元一 Python数据操作.pptx
- 某某单位2024年党建工作总结及2025年工作计划.doc
- 某某市发改委关于2024年度落实党风廉政建设工作责任制情况的报告.doc
- 某某局2024年全面从严治党和党风廉政建设工作总结.doc
- 某某区财政局2024年法治政府建设总结及2025年工作谋划.doc
- 2024年党管武装工作述职报告2篇.doc
- 2024年度国企党委书记抓基层党建工作述职报告3篇.doc
- 公司党委书记2024年述职述廉报告.docx
- 2024年度乡镇党委领导班子民主生活会(四个带头)对照检查材料.doc
- 市医疗保障局关于2024年法治政府建设工作情况的报告.docx
- 市民政局党组2024年巡察整改工作情况报告.docx
文档评论(0)