- 1
- 0
- 约4.32千字
- 约 50页
- 2026-03-11 发布于山东
- 举报
单元7数据处理
任务7.1导入Excel文件数据【任务目标】文件“data1.xlsx”中的工作表“Sheet1”保存了“唐宋八大家”的相关信息,使用pandas导入文件数据,并输出前3行数据。【任务实施】……
7.1数据处理基础创建数据对象数据的基本运算数据处理相关的属性和方法数据的索引和切片数据的导入和导出
安装pandas。在程序中,可使用以下命令导入pandas。pandas的Series对象和DataFrame对象是数据处理过程中两个重要的数据结构。Series对象也称“序列”,用于存储和处理一维数据,类似Excel二维表格中的一行或一列。Series对象由一组数据和与数据相关的索引组成,可以存储和处理整数、浮点数、字符串、Python对象等多种类型的数据。DataFrame对象也称“数据框”,用于存储和处理二维数据,类似Excel二维表格。DataFrame对象由一组数据以及与数据相关的行索引和列索引组成,可以存储和处理整数、浮点数、字符串、Python对象等多种类型的数据。
7.1.1创建数据对象1.创建Series对象Series()方法用于创建Series对象,其基本语法格式如下。其中,相关参数说明如下。(1)data:数据,可以是标量、可迭代对象(如列表)、字典等。(2)index:索引,默认以0开始的整数作为索引。省略所有参数时,该方法将创建一个空Series对象。
示例代码单击此处编辑母版文本样式第二级第三级第四级第五级
2.创建DataFrame对象DataFrame()方法用于创建DataFrame对象,其基本语法格式如下。其中,相关参数说明如下。(1)data:数据,可以是字典、二维数组、Series对象、DataFrame对象或其他可转换为DataFrame对象的数据。省略此参数,则创建一个空DataFrame对象。(2)index:行索引,可以是列表、数组、索引对象等。省略此参数,则创建一个默认的整数索引。(3)columns:列索引,可以是列表、数组、索引对象等。省略此参数,则创建一个默认的整数索引。(4)dtype:指定数据的类型,可以是NumPy库中的数据类型,如np.int64、np.float64等。省略此参数,则根据数据自动推断数据类型。(5)copy:指定是否复制数据,默认值为False,表示不复制数据。如果设置为True,则复制输入的数据。
示例代码
7.1.2数据的基本运算Series对象和DataFrame对象支持各种数据运算,示例代码如下。
7.1.3数据处理相关的属性和方法1.Series对象的常用属性和方法
2.DataFrame对象的常用属性和方法
7.1.4数据的索引和切片Series对象和DataFrame对象支持索引和切片,通过索引可访问和修改元素。
1.访问和修改Series对象元素
2.访问和修改DataFrame对象元素
7.1.5数据的导入和导出1.导入数据pandas常用的数据导入方法如下。(1)read_csv():导入CSV文件。(2)read_table():导入分隔符分隔的文件,默认分隔符为制表符“\t”。(3)read_excel():导入Excel文件。(4)read_json():读取JSON文件。(5)read_sql():从SQL数据库读取数据。(6)read_html():从HTML文件中读取表格数据。这些方法的用法类似,
2.导出数据to_excel()方法可以将数据导出到Excel文件,示例代码如下。导出的“output1.xlsx”工作簿数据如图7-1所示。DataFrame对象的列索引作为Excel表格的列名,行索引作为第1列数据(该表格第1列第1行数据为空)。
可以将数据导出到多个工作表,示例代码如下。to_csv()方法可以将数据导出到CSV文件,示例代码如下。
任务7.2成绩排序【任务目标】文件“data1.xlsx”中的工作表“Sheet3”保存了成绩数据(包括学号、姓名、政治、数学、英语等列),使用pandas导入数据,计算成绩总分,并按总分从高到低排序。【任务实施】……
7.2数据处理操作本节介绍pandas的数据处理功能,包括数据的清洗、筛选、排序、排名、合并、连接、分组统计、透视表创建以及绘图等操作。
7.2.1数据清洗数据清洗指对数据中的无效值、重复值等进行处理。1.处理无效值在导入数据时,pandas将n/a、NA、空值当作无效数据,用NaN表示。文件“data2.xlsx”中包含多个无效值,如图7-3所示。导入文件“data2.xlsx”中的数据,示例代码如下。
除了默认处理的无效值,上述导入数据中的8t、-也属于不符合要求的无效值。可以在导入时,使用na_value
您可能关注的文档
- Python基础与办公自动化电子教案.doc
- Python基础与办公自动化课件 单元1 搭建开发环境.pptx
- Python基础与办公自动化课件 单元2 Python基本语法.pptx
- Python基础与办公自动化课件 单元3 Python数据类型.pptx
- Python基础与办公自动化课件 单元4 程序控制结构.pptx
- Python基础与办公自动化课件 单元5 函数和类.pptx
- Python基础与办公自动化课件 单元6 文件操作.pptx
- Python基础与办公自动化课件 单元8 Python教你玩转Excel文件.pptx
- Python基础与办公自动化课件 单元9 Python 教你玩转Word文档.pptx
- Python基础与办公自动化课件 单元10 Python教你玩转PPT文档.pptx
- 宣贯培训(2026年)《NYT 4512-2025 非洲菊疫病抗性鉴定技术规程》.pptx
- 宣贯培训(2026年)《NYT 4514-2025木薯副产物综合利用导则》.pptx
- 宣贯培训(2026年)《NYT 4513-2025木薯全程机械化生产技术规范》.pptx
- 宣贯培训(2026年)《NYT 4470-2025全株玉米青贮质量分级》.pptx
- 宣贯培训(2026年)《NYT 4468-2025玉米供需平衡表编制规范》.pptx
- 宣贯培训(2026年)《NYT 4469-2025全株玉米青贮质量评定 综合指数法》.pptx
- 宣贯培训(2026年)《NYT 4474-2025东北地区玉米-大豆轮作生产技术规程》.pptx
- 宣贯培训(2026年)《NYT 4472-2025玉米耐盐碱鉴定评价技术规程》.pptx
- 宣贯培训(2026年)《NYT 4473-2025玉米抗旱性鉴定评价技术规程》.pptx
- 宣贯培训(2026年)《NYT 4478-2025甘薯收获技术规程》.pptx
原创力文档

文档评论(0)