- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
课前视频学习任务?4.1问题描述与解题思路.mp4?4.2项目实现.mp4课前实践任务以个人为单位,使用一元线性回归方法求解简单房价预测问题,画出相应的程序流程图,最终实现项目开发;2人一组,结对编程方式,使用多元线性回归方法求解波士顿房价预测问题,画出相应的程序流程图;(第4章项目拓展)
课堂测试(5分钟)
课堂讨论(35分钟)
课堂讨论1、一元线性回归方法的数学推导。
线性回归数理统计中回归分析方法一元线性回归分析多元线性回归分析?
最小二乘法通过最小二乘法求解J的最小值,过程如下:将代入预测函数,可得到预测房价的值:将的值代入总误差公式J中,得:对J分别求和的偏导。偏导等于0时,得到J的最小值,由此求得和的值。
最小二乘法???
最小二乘法?
最小二乘法和的值如下:最终求得和的值代入函数将求得的得到一元线性回归模型。
简单房价预测问题(1)分析数据关系。一元线性回归方法求解
简单房价预测项目代码分析
课堂讨论2、多元线性回归方法的数学推导?
课堂讨论?
课堂讨论为了得到w的最优解,需要取J(w)的最小值。本项目采用对w进行梯度下降(其中α为学习率)的方法获取最优解。整个训练过程就是基于梯度下降的方法去不断缩小预测值与真实值之间差值的过程。表达式如下:?
课堂讨论?
课堂讨论?
课堂讨论??
课堂讨论3、使用多元线性回归方法求解波士顿房价预测问题的程序流程设计
波士顿房价预测数据集分析波士顿房价数据集(部分)CRIMZNINDUSCHASNOXRMAGEDISRADTAXPTRATIOBLSTATMEDV0.259150.0021.89000.62405.693096.001021.20392.1117.1916.200.111320.0027.74000.60905.983083.502020.10396.9013.3520.100.050830.005.19000.51506.316038.106020.20389.715.6822.200.056020.002.46000.48807.831053.603017.80392.634.4550.002.733970.0019.58000.87105.597094.901014.70351.8521.4515.400.253560.009.90000.54405.705077.703018.40396.4211.5016.200.1621120.006.96000.46406.240016.304018.60396.906.5925.20
波士顿房价预测数据集分析属性名解释类型CRIM:城镇人均犯罪率连续值ZN住宅用地所占比例连续值INDUS城镇非商业用地的比例连续值CHAS是否临近查尔斯河,边界是河流为1,否则0离散值,1=临近,0=不临近NOX一氧化氮浓度连续值RM住宅平均房间数连续值AGE1940年之前建成的自用房屋比例连续值DIS到波士顿5个中心区域的加权距离连续值RAD距离高速公路的便利指数连续值TAX每10000美元的全值财产税率连续值PTRATIO城镇师生比例连续值B1000(Bk-0.63)^2,其中Bk指代城镇中黑人的比例连续值LSTAT低收入人群的比例连续值MEDV自住房的平均房价连续值
波士顿房价预测数据集预处理数据预处理:因为各维度数据的单位都不一致,因此在训练模型前,需要对数据归一化处理。归一化方法:(特征值-特征最小值)/(特征最大值-特征最小值)
注意:如果缺少归一化步骤,不同特征值的取值范围大小不同,可能会导致利用梯度下降法训练的结果异常,可能返回的值都是缺失值。
算法步骤步骤1:数据读入步骤2:获取每一维度数据最大和最小值,进行数据归一化处理步骤3:多元线性回归方法进行模型训练(梯度下降法)(数据集拆分,训练集100个,测试集50个)步骤4:房价预测及预测准确度计算。
课堂实践答疑解惑
谢谢观看
原创力文档


文档评论(0)