Python 数据分析与应用电子教案 第4章 数据分析.docxVIP

Python 数据分析与应用电子教案 第4章 数据分析.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第4章数据分析

一、教学目标

让学生掌握数据分析的基本概念和方法,了解数据分析在各领域的应用价值。

教授学生描述性分析、分组分析、结构分析、分布分析、对比分析等常用数据分析方法,并能够运用Python工具进行实际操作。

使学生了解预测分析中的简单线性回归方法及时间序列分析法,掌握其基本原理和应用步骤。

通过案例分析和实训项目,提高学生的数据分析实践能力,培养其数据思维和解决实际问题的能力。

二、教学内容

4.1描述性分析

描述性分析概述:介绍描述性分析的定义、重要性及常用统计指标(如均值、中位数、众数、方差、标准差等)。

商品价格描述性分析:演示如何使用pandas库的describe()函数、agg()函数及Series统计函数对商品价格数据进行描述性分析,并解释统计指标的意义。

4.2分组分析

分组分析概述:阐述分组分析的目的、重要性及分组类型(定性分组和定量分组)。

商品价格分组分析:以“商品表”数据为例,讲解如何使用pandas的groupby()和agg()函数对不同出版社图书的平均价格进行统计分析。

4.3结构分析

结构分析概述:介绍结构分析的定义和应用场景。

商品结构分析:利用“商品表”数据,演示如何统计各个出版社上架图书的比例,包括分组计数、求和及计算比例的步骤。

4.4分布分析

分布分析概述:解释分布分析的定义和作用。

商品分布分析:通过统计不同价格段上架图书数,展示如何使用pandas的cut()函数进行数据分组,并分析数据的分布情况。

4.5对比分析

对比分析概述:介绍对比分析的定义、重要性及指标和维度的概念。

厂商销量对比分析:以2023年中国市场各大电动汽车销量数据为例,讲解如何进行厂商销量对比分析,包括数据导入、计算销量、排序、绘制图表及得出结论的完整过程。

4.6简单线性回归

简单线性回归概述:阐述简单线性回归的定义、价值和意义。

基于简单线性回归模型的销售额预测:通过某电商公司广告费用与销售额数据,详细讲解简单线性回归分析的五步法,包括确定变量、绘制散点图、计算相关系数、建立模型、进行检验和预测的步骤。

4.7预测分析

预测分析概述:介绍预测分析的定义、方法和应用领域。

股票收益率预测分析:以2023年4月到2024年4月的股票收益率及市值数据为例,讲解如何进行股票收益率预测分析,包括数据预处理、计算相关系数、构建回归模型、输出模型结果、绘制回归线及散点图、预测收益率等步骤。

4.8时间序列分析

时间序列分析概述:介绍时间序列分析的定义、基本步骤和应用领域。

流通现金的时间序列分析:以流通中现金数据为例,详细讲解时间序列分析的全过程,包括绘制时间序列图、自相关系数图、单位根检验、差分处理、季节性差分、时间序列分解等步骤。

4.9应用实例——电影票房统计之数据分析

对清洗和转换后的电影票房数据进行分析,包括计算总票房、平均票价,绘制票房前10电影的条形图,进行平均票价和场均人次分析,以及统计不同年份高票房电影数量和不同月份高票房电影数量的占比分析。

三、课后实训

实训项目1:描述性分析操作

导入“第4章课后实训1-data.xlsx”文件,使用pandas库的describe()函数对“sales”字段进行描述性分析,解释得到的统计指标(如计数、平均值、标准差、最小值、最大值等)的意义。

实训项目2:对比分析应用

导入“第4章课后实训2-data.xlsx”文件,编写Python代码,使用对比分析的方法比较两个部门(部门A和部门B)的销售额差异,计算销售额的绝对值和相对值,绘制对比图表,并给出结论,分析两个部门的业绩表现和差异原因。

实训项目3:简单线性回归预测

收集一组数据(如广告费用与销售额、产品价格与销量等),使用简单线性回归模型进行预测分析。绘制数据的散点图,计算相关系数,建立线性回归模型,进行模型检验,并根据模型预测未来的销售额或销量。

实训项目4:时间序列分析实践

选择一个时间序列数据集(如股票价格、气象数据、产品销售数据等),进行时间序列分析。绘制时间序列图,进行平稳性检验和差分处理,绘制自相关系数图和偏自相关系数图,选择合适的模型进行拟合,并预测未来的趋势或值。

实训项目5:综合数据分析项目

结合所学数据分析方法,选择一个实际的数据集(如电商平台的用户行为数据、企业的财务数据等),从数据导入、清洗、转换开始,进行描述性分析、分组分析、对比分析等多种分析,挖掘数据中的有价值信息。

文档评论(0)

释然 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档