Python与机器学习(第2版)(微课版) 课件 3-04-多项式回归预测任务实施.pptx

Python与机器学习(第2版)(微课版) 课件 3-04-多项式回归预测任务实施.pptx

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

课程负责人:陈清华

票房多项式回归预测任务实施

【数据挖掘应用】课程

观影数据回归分析

知识与能力目标

掌握多项式回归分析方法;

会使用sklearn实现多项式回归分析应用;

会熟练使用matplotlib进行可视化展现;

会按需求展现回归模型。

使用多项式回归对票房进行预测

主要内容

任务工单

引导问题

任务评价标准

任务解决方案

代码解析

film.txt

教学难点

基于放映天数构建多项式特征,并使用sklearn中的线性模型实现多项式回归分析。

任务概述

任务描述:

根据放映天数,使用多项式回归分析和预测电影日均票房,并用图的形式展现所到模型的异同。

任务工单

010

01001100110

101010010011011

0100101010000101101110100

10101

0110101001

10

1001

0

(1)线性回归与多项式回归的本质区别是什么?

(2)sklearn中如何实现多项式回归,实现方法上与线性回归有何不同?

(3)sklearn中,线性回归与多项式回归的实现又有何共通之处?

问题引导:

任务概述

任务评价:

任务概述

评价内容

评价要点

分值

分数评定

自我

评价

1.任务实施

数据预处理

记录使用的degree参数值:________

4分

导包正确得1分,能正确构造多项式特征得2分。Degree正确设置得1分

模型训练

1分

代码正确且顺利执行得1分

模型展现

3分

展现原始数据完整得1分,展现结果清晰得1分。结合展现线性回归模型得1分

2.效果评估

分析模型得准确性,并得出评估结论

3分

准确率有提升得1分

3.任务总结

依据任务实施情况总结结论

1分

总结内容切中本任务的重点要点得1分

合计

10分

第1行:导入sklearn包中相关的包

第2、3行:设置x和y的值

fromsklearnimportlinear_model

x=df[[放映天数]]

y=df[[日均票房/万元]]

regr=linear_model.LinearRegression()

任务解决方案

第5行:一元线性回归拟合

regr.fit(x,y)

步骤一:使用一元线性回归进行预测

第4行:初始化线性回归模型

第2行:构造化多项式特征

第4行:构建回归模型进行拟合

poly=PolynomialFeatures(degree=3)

xt=poly.fit_transform(x)

polymodel=linear_model.LinearRegression()

polymodel.fit(xt,y)

任务解决方案

步骤二:使用多项式回归进行预测

第1行:导入sklearn包中相关的包

fromsklearn.preprocessingimportPolynomialFeatures

任务解决方案

plt.scatter(x,y,color=‘black,label=“原始数据”)

plt.scatter(x,regr.predict(x),color=red,linewidth=1,

label=线性回归,marker=*)

plt.scatter(x,polymodel.predict(xt),color=blue,linewidth=1,

label=多项式回归,marker=^)

plt.legend(loc=2)

步骤三:可视化并比较

任务解决方案

x_min=x.values.min()-0.1

x_max=x.values.max()+0.1

第20、21行:定义界限

第20、21行:定义等距序列,最小值是x_min,最大值是x_max,步长是0.005

x_new=np.arange(x_min,x_max,0.005).reshape(-1,1)

xt_new=poly.fit_transform(x_new)

第22行:定义界限

plt.scatter(x,y,color=black,label=原始数据)

第23行:多项式回归模型结果可视化

plt.scatter(x_new,regr.predict(x_new),color=red,s=2,linewidth=1,label=线性回归)

步骤四:可视化进阶

第24行:在左上角显示图例

plt.legend(loc=2)

plt.show()

任务解决方案

图像显示

步骤四:可视化进阶

小结

1.什么是多项式回归分析?

2.sklearn如何实现

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档