- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
12/11/23,3:37PM1.2拓展实训:观影数据统计(实验报告)
《数据挖掘应用》
《Python与机器学习(第二版)》
拓展实训(一):观影数据统计
实训要求:
【实训目的】
通过本次实训,要求初步掌握数据分析过程和Python数据分析常用包:Pandas、matplotlib的基本使用。
【实训环境】
PyCharm或Anacorda环境、Pandas、NumPy、matplotlib
【实训内容】
一个完整、充分的数据统计过程主要包括以下步骤:
1.收集/观察数据;
2.探索和准备数据;
3.基于数据统计与分析;
4.结果的可视展现。
在接下来的实训中,按照以上步骤对数据进行统计。
统计分析需要使用2010年5月各个电影的票房数据,所有数据存储于文件film.csv中。现需要根据各电影票房
数据及其它基本信息,展示某部电影在一定期间内的票房变化趋势和动态预测。
file:///F:/2022-2023-2/3-教改/50-202308专业资源库建设(在研)/02-福建信息-大数据/202309-数据挖掘应用课程/02-资源建设/项目01GDP数值…1/11
12/11/23,3:37PM1.2拓展实训:观影数据统计(实验报告)
【环境准备】
相关库包的安装与配置,如已经安装可跳过~
python-mpipinstall--upgradepip
pipinstallmatplotlib
pipinstallpylab
pipinstallpandas
1数据获取:从本地文件(film.csv)中读取电影原始数据
In[1]:#coding:utf-8
#导入包
importpandasaspd
#从文件read_csv中获取数据
#输出从文件中读取的部分结果
film.head()
Out[1]:
datefilmnameBOR
02010-05-09唐山大地震51315.0
12010-05-16老男孩1599.0
22010-05-23剑雨2224.0
32010-05-23剑雨NaN
42010-05-23老男孩1605.0
2数据解析
2.1从数据项中去除票房数据项为空的“脏数据“
In[2]:#清洗掉缺失的数据
file:///F:/2022-2023-2/3-教改/50-202308专业资源库建设(在研)/02-福建信息-大数据/202309-数据挖掘应用课程/02-资源建设/项目01GDP数值…2/11
12/11/23,3:37PM1.2拓展实训:观影数据统计(实验报告)
Out[2]:
datefilmnameBOR
02010-05-09唐山大地震51315.0
12010-05-16老男孩1599.0
22010-05-23剑雨2224.0
42010-05-23老男孩1605.0
52010-05-09唐山大地震
您可能关注的文档
- 01《神舟十七号》新闻页制作—课业1.docx
- 1 (1).1职业定义及概况.ppt
- 1 耳及听力保健.pdf
- 1 花卉主要虫害及防治方法.docx
- 1、古希腊和罗马音乐和中世纪音乐.pdf
- 1. 婴幼儿家庭教育认知.docx
- 1.1 (1).5果树年生长发育规律4.ppt
- 1.1.3果树树体组成及特点.ppt
- 1.1.3果树树体组成及特点下.ppt
- 1.1.4果树生命周期.ppt
- 浙江省温州市浙南名校联盟2025-2026学年高一上学期期中联考数学试题含解析.docx
- 26高考数学提分秘诀重难点34圆锥曲线中的定点、定值、定直线问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点35概率与统计的综合问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点31圆锥曲线中的切线与切点弦问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点30圆锥曲线中的弦长问题与长度和、差、商、积问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点29巧解圆锥曲线的离心率问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点28直线与圆的综合(举一反三专项训练)(全国通用)(含解析).docx
- 寡核苷酸药物重复给药毒性研究技术指南.docx
- 重组溶瘤腺病毒生产质量管理标准.docx
- 26高考数学提分秘诀重难点27直线与圆中常考的最值与范围问题(举一反三专项训练)(全国通用)(含解析).docx
原创力文档


文档评论(0)