- 1、本文档共96页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Python与机器学习 实验报告
学生学号
实训成绩
《电影数据统计》
实验报告
实验课程
实验项目 电影数据统计
指导教师
班 级
学生姓名
日 期
陈清华
2019年12月制
电影数据统计
学习情境
数据统计
子情境
数据统计基本流程
教学单元
项目一
总学时
3
实施环境
本地计算机
实施时间
(学时)
1.5
任务描述
通常,进行数据分析的基本步骤包括以下5步。
(1)明确目的:分析要解决什么问题,从哪些角度分析问题,采用哪些方法或指标。
(2)数据获取:明确数据获取的途径,主要是本地数据采集和网络数据获取。
(3)数据解析:把杂乱无章的数据处理成一定结构,形成有效数据的过程。
(4)数据分析:对数据进行分析操作,比如分组、聚合操作。
(5)结果呈现:将数据以图的形式直观地进行展示。
本项目基于上述步骤,了解数据的读取、清洗、简单统计分析与可视化展现。
任务准备
1.学习有关Pycharm/Anaconda集成环境的使用,数据分析流程相关基本知识。
2.一台装有PyCharm/Anaconda集成开发环境的Windows 系统。
任务实施
电影数据读取
数据清洗
数据筛选
数据统计
数据可视化
【实验目的】
熟练掌握PyCharm/Anaconda集成开发环境的使用方法。
掌握数据分析的一般过程。
了解数据获取的主要途径。
学会读取CSV本地文件。
初步学会Python数据分析常用包的使用方法:Pandas、Matplotlib等。
掌握使用柱状图来实现数据的可视化,并能对坐标轴、标题、颜色等属性进行设置。
了解散点图的画法。
【实验环境】
PyCharm环境、Python 3.7、Pandas、NumPy、Matplotlib。
【实验内容及实施步骤】
一、文件读取
从film.csv中读取数据
读取代码如下:
显示结果截图如下:
二、数据清洗
将空值替换为0值,并去除重复行
代码如下:
显示结果截图如下:
三、数据筛选
(1)从数据中筛选电影名称为“老男孩”的数据
代码如下:
显示结果截图如下:
(2)从数据中筛选出放映日期为2010年05月前半月
代码如下:
显示结果截图如下:
(3)筛选票房数据“1600”且名称为“老男孩”或“剑雨”的数据行
代码如下:
显示结果截图如下:
四、数据统计
(1)按电影名称统计前半月的日平均票房
代码如下:
显示结果截图如下:
(2)统计每日放映的电影部数
代码如下:
显示结果截图如下:
五、数据可视化(一)
(1)图形化显示不同电影的票房情况
代码如下:
显示结果截图如下:
(2)按从小到大图形化显示不同电影的票房情况
代码如下:
显示结果截图如下:
六、数据可视化(二)
(1)格式化显示不同电影的票房情况,参考代码及格式如下:
代码如下:
显示结果截图如下:
(2)子图的效果显示上图(左边绿色格式化前、右边蓝色格式化后):
参考代码如下:
# 创建自定义图像fig = plt.figure()
# 令ax1为1行2列图形的第1个坐标系ax1 = fig.add_subplot(1, 2, 1)
# 令ax2为1行2列图形的第2个坐标系
ax2 = fig.add_subplot(1, 2, 2)scale=range(len(filmgrp_bor[filmname]))# 在ax1坐标系上画出柱状图,并设置相应参数
ax1.bar(filmgrp_bor[filmname],filmgrp_bor[bor], color=blue, width=0.4)
# 在ax2坐标系上画出柱状图,并设置相应参数ax2.bar(film_sort[filmname],film_sort[BOR], color=green, width=0.4)ax1.set_title(排序前)ax2.set_title(排序后)plt.show()
显示结果截图如下:
你的代码如下:
你的显示结果截图如下:
【实验总结】
通过本次实验,已掌握:
答:
存在的疑问:
答:
课堂笔记:
【课后思考】
本项目中用的第三方库包有哪些?
数据分析的基本流程
统计函数有哪几种,可以分别用来做什么?
【课后思考与课堂思政】
请你谈谈在数据分析中哪些地方体现了中国工匠精神
请参考日常生活中的数据,对其进行数据分析与可视
文档评论(0)