python数据分析基础教程教案 (第10章 电影数据分析项目).docVIP

python数据分析基础教程教案 (第10章 电影数据分析项目).doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

《Python数据分析基础教程》

PAGE1

课程基本信息

课程名称

Python数据分析基础教程

授课班级

授课课题名

电影数据分析项目

计划课时

4课时

授课时间

第周第课时

课型

教学做一体化

教学目标

了解电影数据分析项目。

熟悉电影数据分析流程。

掌握数据预处理方法。

掌握数据分析方法。

掌握数据可视化方法。

教学重点

电影数据分析流程。

数据预处理方法。

教学难点

数据分析方法

数据可视化方法

教法与学法

教法:案例教学法;

学法:探究学习、小组合作学习。

教学过程

【任务引入】

分组讨论

如何进行电影数据分析?

【新课讲授】

任务一:电影数据分析项目——项目描述

知识点讲解

IMDB(InternetMovieDatabase)是目前全球互联网中较大的一个电影资料库,在该电影资料库中有丰富的电影作品信息,包括影片演员、导演、电影题材、片长、剧情关键字、分级、评分等关于影片的基本信息,其中使用最多的就是IMDB的评分。

IMDB创建于1990年10月17日,从1998年开始成为亚马逊公司旗下网站。IMDB正式启动于1993年,是互联网上第一个完全以电影为内容的网站。与之相似的国内网站有豆瓣网站。

在电影数据分析项目中,选择的数据集是从IMDB网站上抓取的从1916年至2016年这100年间出品的5043部电影数据,该数据集称为IMDB5000部电影数据集,文件名为movie_metadata.csv,它也是电影数据分析项目中常用的经典数据集。在该数据集中包含28个属性、4906张海报,电影时间跨度超过100年,共有65个国家及地区的影片,并包括2399位导演和数千位演员的信息。近些年中国国产电影取得了辉煌的成就,根据2025年3月19日,猫眼专业版数据显示,《哪吒之魔童闹海》(《哪吒2》)全球票房(含预售及海外)已突破150亿元,跻身全球电影票房榜前5。MDB5000部电影数据集的属性信息如表10-1所示。

要求根据IMDB5000部电影数据集进行下列数据分析。

1.电影出品国及地区的情况分析。

2.电影数量的分析。

3.电影类型的分析。

4.电影票房统计及电影票房相关因素的分析。

5.电影评分统计及电影评分相关因素的分析。

学生自主提问,教师对疑难问题进行解答。

任务二:电影数据分析项目——数据准备

案例讲解

在数据准备中,主要的任务是导入“movie_metadata.csv”文件,

其程序代码如下。

In[1]:importpandasaspd

importmatplotlib.pyplotasplt

In[2]:#加载数据

movies_df=pd.read_csv(d:/data/movie_metadata.csv,encoding=GBK)

In[3]:movies_df.head()#输出默认头5行

In[4]:movies_df.info()#输出movies_df的信息

movies_df.describe()#输出movies_df的基本统计量和分位数等值

学生练习,教师对疑难问题进行解答。

任务三:电影数据分析项目——数据清洗

案例讲解

在电影数据分析项目中,数据清洗的主要任务是对原始数据集进行缺失值和重复数据的处理。其步骤如下:

1.统计每列的缺失值个数

2.删除任何含有缺失值的行

3.删除重复数据

4.查看数据清洗后的信息

5.输出movies_df_new的基本统计量和分位数等值

学生练习,教师对疑难问题进行解答。

任务四:数据分析与数据可视化

知识点和案例讲解

在电影数据分析项目中,数据分析与数据可视化的主要内容如下:

1、电影出品国及地区的情况分析

(1)统计每个国家或地区出品的电影数量

(2)显示电影出品数量排名前10的国家或地区

(3)绘制电影出品数量排名前10的柱形图(见图10-1)

2、电影数量的分析

(1)按年份统计每年的电影数量

(2)绘制每年的电影数量图形(见图10-2)

(3)按年份统计每年的电影总数量、彩色影片数量和黑白影片数量,并绘制每年电影总数量、彩色影片数量和黑白影片数量图形(见图10-3)

3、电影类型的分析

(1)计算不同类型的电影数量。

(2)绘制不同类型的电影数量图形(见图10-4)

(3)绘制各个电影类型的饼图(见图10-5

文档评论(0)

释然 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档