- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
课程负责人:陈清华
票房多项式回归预测任务实施
【数据挖掘应用】课程
观影数据回归分析
知识与能力目标
掌握多项式回归分析方法;
会使用sklearn实现多项式回归分析应用;
会熟练使用matplotlib进行可视化展现;
会按需求展现回归模型。
使用多项式回归对票房进行预测
主要内容
任务工单
引导问题
任务评价标准
任务解决方案
代码解析
film.txt
教学难点
基于放映天数构建多项式特征,并使用sklearn中的线性模型实现多项式回归分析。
任务概述
任务描述:
根据放映天数,使用多项式回归分析和预测电影日均票房,并用图的形式展现所到模型的异同。
任务工单
010
01001100110
101010010011011
0100101010000101101110100
10101
0110101001
10
1001
0
(1)线性回归与多项式回归的本质区别是什么?
(2)sklearn中如何实现多项式回归,实现方法上与线性回归有何不同?
(3)sklearn中,线性回归与多项式回归的实现又有何共通之处?
”
问题引导:
任务概述
任务评价:
任务概述
评价内容
评价要点
分值
分数评定
自我
评价
1.任务实施
数据预处理
记录使用的degree参数值:________
4分
导包正确得1分,能正确构造多项式特征得2分。Degree正确设置得1分
模型训练
1分
代码正确且顺利执行得1分
模型展现
3分
展现原始数据完整得1分,展现结果清晰得1分。结合展现线性回归模型得1分
2.效果评估
分析模型得准确性,并得出评估结论
3分
准确率有提升得1分
3.任务总结
依据任务实施情况总结结论
1分
总结内容切中本任务的重点要点得1分
合计
10分
第1行:导入sklearn包中相关的包
第2、3行:设置x和y的值
fromsklearnimportlinear_model
x=df[[放映天数]]
y=df[[日均票房/万元]]
regr=linear_model.LinearRegression()
任务解决方案
第5行:一元线性回归拟合
regr.fit(x,y)
步骤一:使用一元线性回归进行预测
第4行:初始化线性回归模型
第2行:构造化多项式特征
第4行:构建回归模型进行拟合
poly=PolynomialFeatures(degree=3)
xt=poly.fit_transform(x)
polymodel=linear_model.LinearRegression()
polymodel.fit(xt,y)
任务解决方案
步骤二:使用多项式回归进行预测
第1行:导入sklearn包中相关的包
fromsklearn.preprocessingimportPolynomialFeatures
任务解决方案
plt.scatter(x,y,color=‘black,label=“原始数据”)
plt.scatter(x,regr.predict(x),color=red,linewidth=1,
label=线性回归,marker=*)
plt.scatter(x,polymodel.predict(xt),color=blue,linewidth=1,
label=多项式回归,marker=^)
plt.legend(loc=2)
步骤三:可视化并比较
任务解决方案
x_min=x.values.min()-0.1
x_max=x.values.max()+0.1
第20、21行:定义界限
第20、21行:定义等距序列,最小值是x_min,最大值是x_max,步长是0.005
x_new=np.arange(x_min,x_max,0.005).reshape(-1,1)
xt_new=poly.fit_transform(x_new)
第22行:定义界限
plt.scatter(x,y,color=black,label=原始数据)
第23行:多项式回归模型结果可视化
plt.scatter(x_new,regr.predict(x_new),color=red,s=2,linewidth=1,label=线性回归)
步骤四:可视化进阶
第24行:在左上角显示图例
plt.legend(loc=2)
plt.show()
任务解决方案
图像显示
步骤四:可视化进阶
小结
1.什么是多项式回归分析?
2.sklearn如何实现
您可能关注的文档
- Python与机器学习(第2版)(微课版) 课件 01-06-拓展实训:电影数据加工与处理.pptx
- Python与机器学习(第2版)(微课版) 课件 1-02-数据集成任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-01-碳排放数据异常分析项目概述.pptx
- Python与机器学习(第2版)(微课版) 课件 2-03-分布分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-03-分组分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-04-交叉分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-05-结构分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-06-相关分析任务实施.pptx
- Python与机器学习(第2版)(微课版) 课件 2-07-应用拓展:观影数据复杂分析.pptx
- Python与机器学习(第2版)(微课版) 课件 2-08-应用拓展:用餐数据复杂分析.pptx
- 北师大版小学数学三年级上册《寄书》教学设计.docx
- 统编版(部编版)语文二年级上册《雪孩子》教学设计.docx
- 统编版(部编版)语文二年级上册《八角楼上》教学设计.docx
- 北师大版小学数学三年级上册《长方形周长》教学设计.docx
- 北师大版小学数学三年级上册《丰收了》教学设计.docx
- 统编版(部编版)语文二年级上册《夜宿山寺》教学设计.docx
- 统编版(部编版)语文二年级上册《风娃娃》教学设计.docx
- 统编版(部编版)语文二年级上册《朱德的扁担》教学设计.docx
- 统编版(部编版)语文二年级上册《难忘的泼水节》教学设计.docx
- 统编版(部编版)语文二年级上册《纸船和风筝》教学设计.docx
最近下载
- 米LED路灯灯杆检验报告.pdf VIP
- 临床诊疗指南肾脏病学分册_全文.pdf
- 中小学校园防疫科普讲义中小学防控诺如病毒主题班会课件.pptx VIP
- 安永-中国房地产行业2023年业绩概览及新质态下房地产行业发展新趋势.pdf VIP
- Nikon 尼康微型单电相机 Z系列Z 6 参考手册(完整说明书)Z7Z6RM_(Sc)05.pdf
- 2024年义务教育新课标新教材培训学习PPT课件:小学语文新教材内容整体变化解读.pptx
- 上海市高一信息技术上学期期中试题.docx
- 支架和钢管柱贝雷梁现浇简支箱梁施工安全质量控制要点.pptx VIP
- 名著导读《朝花夕拾》课件(共47张ppt).pptx VIP
- 商用车行业专题:全球客车潜力可观,中国车企大有可为.docx VIP
文档评论(0)