- 6
- 0
- 约2.68千字
- 约 26页
- 2022-06-13 发布于广东
- 举报
课程结构
第1章 数据分析与Python语言
第2章 Python数据处理
第3章 数据可视化分析
第4章 数据的描述分析
第5章 推断分析基本方法
第6章 相关与回归分析
第7章 时间序列分析;;学习目标
掌握Python语言的数据类型及其处理方法
掌握数据抽样、筛选和生成随机数的方法
用Python语言生成频数分布表
思政目标
数据处理是数据分析的前期工作。在数据处理过程中要本着实事求是的态度,避免为达到个人目的而有意加工和处理数据
数值数据分组的目的是通过数据组别对实际问题进行分类,分组的应???要反映社会正能量,避免利用不合理的分组歪曲事实;Python的6种数据结构
ython3中有6种基本的数据结构或称数据类型,分别是数字(number)、字符串(string)、元组(tuple)、列表(list)、字典(dictionary)、集合(set),这6种数据类型通过不同的组成方式和定义可以产生更多的类型
使用内置函数type()可以查看数据的类型;元组
元组是一维序列,其定长是固定的、不可变的,内容不能修改
通常用“( )”标识,元素之间用“,”分隔。比如,输入(1,2,3,4,5)就生成了一个元组;元组
元组是一维序列,其定长是固定的、不可变的,内容不能修改
通常用“( )”标识,元素之间用“,”分隔。比如,输入(1,2,3,4,5)就生成了一个元组; 列表的操作;字典
字典是Python最重要的内置结构之一,它是大小可变的键值对集,其中键(key)和值(value)都是Python对象。字典中的元素用大括号{ }括起来,用“:”分割键和值,不同的键值组合之间用“,”分隔。用大括号“{ }”或dict函数可以创建字典,其形式如下:
dictionary={key1:value1,key2:value2,……}
或写成:
dictionary=dict(key1=value1,key2=value2,……);集合
集合是由唯一元素组成的无序集,可看成是只有键没有值的字典。由于集合中的元素是无序的,不记录元素的位置,因此不支持索引、切片等类似序列的操作,只能遍历或使用in、not in等访问或判断集合元素。使用set()函数或大括号“{ }”的方式等可以创建集合,一个空集合必须使用set()创建;n维数组
numpy是numerical python的简称,它是Python中数值计算的最重要的基础模块。n维数组(ndarray)是numpy模块中定义的对象,它可以是一维、二维和多维,数组中元素类型是数值型。n维数组由实际数据和描述这些数据的元数据(数据维度,数据类型等)组成,一般要求所有元素类型相同,数组下标从0开始
一维数组就是通常所说的向量(vector),二维数组就是通常所说的矩阵(matrix)。可以通过构造函数array创建n维数组,也可以使用numpy中的其他函数如arange函数、ones函数以及zeros函数等创建n维数组使用内置函数type()可以查看数据的类型;序列
序列类似于一维数组,不同的是它由索引(index)和一维数值(values)组成
序列可以储存整数、浮点数、字符、Python对象等多种类型的数据,但一个序列最好只存储一种类型的数据,若存在多种数据类型,该序列的类型会自动转换成对象
使用Series函数可创建序列,使用前需要导入pandas模块; pandas中的序列和数据框;数据框
数据框是pandas中的另一个重要数据结构,它是一种表格结构的数据,类似于Excel中的数据表,也是较为常见的数据形式。数据框实际上是带标签的二维数组,一个数据框由行索引(index)、列索引(columns)和二维数据(values)组成。数据框的每一列和每一行都是一个序列。为了便于分析,一般要求数据框一列只存储一种类型的数据
创建数据框
使用pandas的构造函数DataFrame可创建数据框,其中的参数data为数组或字典。也可以直接读入数据框形式的csv格式或Excel数据作为pandas的框数据使用Series函数可创建序列,使用前需要导入pandas模块;数据框的操作
使用table1_1.head()默认显示数据框table1_1的前5行,如果只想显示前3行,则可以写成table1_1.head(3)。使用table1_1.tail()默认显示数据框table1_1的后5行,如果想显示后3行,则可以写成table1_1.tail(3)
使用type函数可以查看数据的类型
使用table1_1.shape可以查看数据框table1_1的行数和列数属性
使用info()方法查看数据的结构
使用describe()方法可以对数据框的数值型变量进行简单的描述统计;数据框的排序
使
原创力文档

文档评论(0)