- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
项目背景|项目概述|学习目标|任务实施步骤项目观影数据回归分析【数据挖掘应用】主讲人:陈清华
背景先导项目概述项目学习目标任务实施步骤01Background02BriefIntroduction03LearningObjectives04ImplementationSteps主要内容
电影业发展背景得益于国民经济的持续快速增长,以及国家对于文化产业的支持,整个电影文化与产业环境持续改善。作为文化娱乐市场重要组成部分的电影市场已连续多年实现电影票房的快速增长。同时,电影市场还吸引了各类社会资本(国有、民营、外资)积极进军影视行业,从而进一步推动了电影行业的良性快速发展。改革开放四十多年来,国内经济不断发展,人们的生活越过越好,品质不断提高。2012年召开的党的十八大着眼于全面建成小康社会、实现社会主义现代化和中华民族伟大复兴。全面建成小康社会后,人们的生活有了翻天覆地的变化。人们的生活更加有姿有色、更加丰富多彩。
数据分析在电影行业的应用目前,网络上公开了多个电影数据集,比如MovieDatabase网站就提供了一份数据集,主要包括1960至2015年上映的部分电影的样本集。读者可以从上面下载数据集进行分析。电影数据项主要包括:电影名称、电影放映日期、导演、电影分类、电影评分数据及票房数据等良好的分析和预测方法可以帮助投资者进行更清晰的分析来投资电影,以期获得更高的收益。为更好地分析电影总体发展状况及投资的可行性,需要对原始电影数据进行采集、清洗、处理、分析和预测。
项目总体要求观影数据回归分析本项目将使用浙江省高职高专院校技能大赛“大数据技术与应用”赛项试题中使用的电影历史数据,对未来的票房与评分进行简单预测。
项目三维目标理解回归分析的基本概念、原理及其优劣势;(阿里云大数据分析与应用职业技能等级标准中级5.1.2)掌握线性回归(LinearRegression)、多项式回归的基本实现方法;(重点)掌握数据预处理的方法,特别是归一化处理、数值化处理等;掌握数据集的切分方法,以及训练集、测试集与验证集的基本概念。知识目标技能目标素养目标证
项目三维目标会使用sklearn中的线性模型实现对电影数据的回归分析;(重点)会使用sklearn中的范围缩放实现数据的归一化处理;(大数据工程技术人员国家职业技术技能标准4.2.4)会使用sklearn中的标记映射实现对文本数据的数值化处理;会使用sklearn中的数据预处理模块对数据集进行随机切分。知识目标技能目标素养目标证
项目三维目标强化精益求精的品质意识,进一步提升岗位职业素养;善于细致地分析数据,发现不同因素间的关系,增强学生的使命感与责任感;强化数据驱动的大数据行业价值观和职业精神。技能目标素养目标知识目标
项目实施步骤数据查看与检查数据预处理票房数据读取与加载使用pandas工具包从CSV文件中读取数据,并使用正确的数据结构进行存储,方便后期加工与处理。票房数据回归分析可视化与应用
项目实施步骤数据查看与检查数据预处理票房数据回归分析显示加载好的数据,并检查相应数据内容。当数据记录较大时,可通过必要的数据清洗、筛选,分段读取数据。票房数据读取与加载可视化与应用
项目实施步骤数据预处理票房数据回归分析结合数据分析任务,完成归一化处理和数据标签映射。可视化与应用票房数据读取与加载数据查看与检查
项目实施步骤票房数据回归分析训练回归模型,并对模型进行评估。一元线性回归分析多项式回归分析多元线性回归分析票房数据读取与加载数据查看与检查数据预处理可视化与应用
项目实施步骤可视化展现模型,直观地查看模型的优劣,并将模型应用于预测。票房数据读取与加载数据查看与检查数据预处理可视化与应用票房数据回归分析
还在等什么?马上动手实施观影数据回归分析项目吧~1.回归分析基础2.回归分析基本流程小结
您可能关注的文档
- Python与机器学习(第2版)(微课版) 课件 01-04-缺失值处理任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 01-05-异常值处理任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 01-06-拓展实训:电影数据加工与处理.pptx
- Python与机器学习(第2版)(微课版) 课件 1-02-数据集成任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-01-碳排放数据异常分析项目概述.pptx
- Python与机器学习(第2版)(微课版) 课件 2-03-分布分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-03-分组分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-04-交叉分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-05-结构分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-06-相关分析任务实施.pptx
文档评论(0)