- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
《Python数据分析基础教程》
教
案
PAGE1
课程基本信息
课程名称
Python数据分析基础教程
授课班级
授课课题名
电影数据分析项目
计划课时
4课时
授课时间
第周第课时
课型
教学做一体化
教学目标
了解电影数据分析项目。
熟悉电影数据分析流程。
掌握数据预处理方法。
掌握数据分析方法。
掌握数据可视化方法。
教学重点
电影数据分析流程。
数据预处理方法。
教学难点
数据分析方法
数据可视化方法
教法与学法
教法:案例教学法;
学法:探究学习、小组合作学习。
教学过程
【任务引入】
分组讨论
如何进行电影数据分析?
【新课讲授】
任务一:电影数据分析项目——项目描述
知识点讲解
IMDB(InternetMovieDatabase)是目前全球互联网中较大的一个电影资料库,在该电影资料库中有丰富的电影作品信息,包括影片演员、导演、电影题材、片长、剧情关键字、分级、评分等关于影片的基本信息,其中使用最多的就是IMDB的评分。
IMDB创建于1990年10月17日,从1998年开始成为亚马逊公司旗下网站。IMDB正式启动于1993年,是互联网上第一个完全以电影为内容的网站。与之相似的国内网站有豆瓣网站。
在电影数据分析项目中,选择的数据集是从IMDB网站上抓取的从1916年至2016年这100年间出品的5043部电影数据,该数据集称为IMDB5000部电影数据集,文件名为movie_metadata.csv,它也是电影数据分析项目中常用的经典数据集。在该数据集中包含28个属性、4906张海报,电影时间跨度超过100年,共有65个国家及地区的影片,并包括2399位导演和数千位演员的信息。近些年中国国产电影取得了辉煌的成就,根据2025年3月19日,猫眼专业版数据显示,《哪吒之魔童闹海》(《哪吒2》)全球票房(含预售及海外)已突破150亿元,跻身全球电影票房榜前5。MDB5000部电影数据集的属性信息如表10-1所示。
要求根据IMDB5000部电影数据集进行下列数据分析。
1.电影出品国及地区的情况分析。
2.电影数量的分析。
3.电影类型的分析。
4.电影票房统计及电影票房相关因素的分析。
5.电影评分统计及电影评分相关因素的分析。
学生自主提问,教师对疑难问题进行解答。
任务二:电影数据分析项目——数据准备
案例讲解
在数据准备中,主要的任务是导入“movie_metadata.csv”文件,
其程序代码如下。
In[1]:importpandasaspd
importmatplotlib.pyplotasplt
In[2]:#加载数据
movies_df=pd.read_csv(d:/data/movie_metadata.csv,encoding=GBK)
In[3]:movies_df.head()#输出默认头5行
In[4]:movies_df.info()#输出movies_df的信息
movies_df.describe()#输出movies_df的基本统计量和分位数等值
学生练习,教师对疑难问题进行解答。
任务三:电影数据分析项目——数据清洗
案例讲解
在电影数据分析项目中,数据清洗的主要任务是对原始数据集进行缺失值和重复数据的处理。其步骤如下:
1.统计每列的缺失值个数
2.删除任何含有缺失值的行
3.删除重复数据
4.查看数据清洗后的信息
5.输出movies_df_new的基本统计量和分位数等值
学生练习,教师对疑难问题进行解答。
任务四:数据分析与数据可视化
知识点和案例讲解
在电影数据分析项目中,数据分析与数据可视化的主要内容如下:
1、电影出品国及地区的情况分析
(1)统计每个国家或地区出品的电影数量
(2)显示电影出品数量排名前10的国家或地区
(3)绘制电影出品数量排名前10的柱形图(见图10-1)
2、电影数量的分析
(1)按年份统计每年的电影数量
(2)绘制每年的电影数量图形(见图10-2)
(3)按年份统计每年的电影总数量、彩色影片数量和黑白影片数量,并绘制每年电影总数量、彩色影片数量和黑白影片数量图形(见图10-3)
3、电影类型的分析
(1)计算不同类型的电影数量。
(2)绘制不同类型的电影数量图形(见图10-4)
(3)绘制各个电影类型的饼图(见图10-5
您可能关注的文档
- python数据分析基础教程教案 (第4章 NumPy 数组与矢量计算).doc
- python数据分析基础教程教案 (第5章 用NumPy进行简单统计).doc
- python数据分析基础教程教案 (第6章 数据可视化工具).doc
- python数据分析基础教程教案 (第7章 pandas数据分析基础).doc
- python数据分析基础教程教案 (第8章 用pandas 进行数据预处理).doc
- python数据分析基础教程教案(第2章 Python与数据分析).doc
- python数据分析基础教程教案(第3章 Python语言基础).doc
- python数据分析基础教程教案(第9章 机器学习库scikit-learn入门).doc
- 黑边卡通渲染.doc
- 建立公交驾驶员心理疏导机制之探讨.doc
最近下载
- --水库除险加固工程下闸蓄水验收建设管理工作报告汇.doc
- 艺考合作计划书.pptx VIP
- 2023被动式超低能耗建严寒和寒冷地区居住建筑.docx VIP
- GB/T 2484-2023固结磨具 形状类型、标记和标志.pdf
- TBT1632.3-2019 钢轨焊接 第3部分:铝热焊接.pdf VIP
- 一元一次不等式 课件.pptx VIP
- 2家政服务 合同管理规范DB44!T 2290—2021.pdf VIP
- GB51057-2015 种植塑料大棚工程技术规范.pdf VIP
- Unit 8 Collecting as a hobby 词汇 课件 沪教牛津版英语七年级上册 .pptx VIP
- 牛津版三年级上册英语全册新优质教学课件(配2024年秋改版教材).pptx
文档评论(0)