- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第5章机器学习与实现一元线性回归多元线性回归线性回归应用举例
一元线性回归第5章引例1:有一则新闻:预计20××年中国旅游业总收入将超过3000亿美元。这个数据是如何预测出来的呢?引例2:身高预测问题:子女的身高(y),父母的身高(x)旅游总收入(y)居民平均收入(x)……变量之间的相互关系,主要有3种:①确定的函数关系,。②不确定的统计相关关系,。③没有关系,不用分析。以上两个例子均属于第(2)种情况。
一元线性回归第5章一元线性回归模型y为因变量(随机变量),x为自变量(确定的变量),为模型系数,每给定一个x,就得到y的一个分布。
一元线性回归第5章对回归模型两边取数学期望,得到以下回归方程:每给定一个x,便有y的一个数学期望值与之对应,它们是一个函数关系。一般地,通过样本观测数据,可以估计出以上回归方程的参数,一般形式为:其中为对期望值及两个参数的估计
一元线性回归第5章对总体(x,y)进行n次独立观测,获得n个样本观测数据,即(x1,y1),(x2,y2),…,(xn,yn),将其绘制在图像上。如何对这些观测值给出最合适的拟合直线呢?使用最小二乘法。其基本思路是真实观测值与预测值(均值)总的偏差平方和最小,计算公式如下:求解以上最优化问题,即得到:其中最后得到了基于经验的回归方程
一元线性回归第5章总离差平方和TSS、回归平方和RSS、残差平方和ESS,计算公式分别如下:可以证明:回归方程的线性关系是否显著,可以用一个指标公式来计算:称为拟合优度(判定系数),值越大表明直线拟合程度越好。
多元线性回归第5章前文介绍了只有一个自变量和一个因变量的一元线性回归模型,然而在现实中自变量通常包含多个,这时称它为多元线性回归模型对于总体的n个观测值,满足以下公式:其中相互独立,且记,则其矩阵形式为其中即为待估计的向量
多元线性回归第5章对两边取期望值,即得到以下回归方程:其一般的形式如下其中分布为期望值及回归系数的估计的参数估计(最小二乘法,过程略)为的参数估计(推导过程略)为其中,H称为对称幂等矩阵与一元线性回归模型类似,拟合优度(判定系数)公式为:
线性回归应用举例第5章在发电场中电力输出(PE)与温度(AT)、压力(V)、湿度(AP)、压强(RH)有关,相关测试数据(部分)如表所示ATVAPRHPE8.3440.771010.8490.01480.4823.6458.491011.474.2445.7529.7456.91007.1541.91438.7619.0749.691007.2276.79453.09…………需实现的功能如下:(1)利用线性回归分析命令,求出PE与AT、V、AP、RH之间的线性回归关系式系数向量(包括常数项)和拟合优度(判定系数),并在命令窗口输出。(2)现有某次测试数据AT=28.4、V=50.6、AP=1011.9、RH=80.54,试预测其PE值。
线性回归应用举例第5章1.读取数据,确定自变量x和因变量yimportpandasaspddata=pd.read_excel(发电场数据.xlsx)x=data.iloc[:,0:4].valuesy=data.iloc[:,4].values
线性回归应用举例第5章(1)导入线性回归模块(简称LR)。fromsklearn.linear_modelimportLinearRegressionasLR(2)利用LR创建线性回归对象lr。lr=LR()(3)调用lr对象中的fit()方法,对数据进行拟合训练。lr.fit(x,y)(4)调用lr对象中的score()方法,返回其拟合优度,观察线性关系是否显著。Slr=lr.score(x,y)#判定系数R2(5)取lr对象中的coef_、intercept_属性,返回x对应的回归系数和回归系数常数项。c_x=lr.coef_#x对应的回归系数c_b=lr.intercept_#回归系数常数项2.线性回归分析
线性回归应用举例第5章(1)可以利用lr对象中的predict()方法进行预测。importnumpyasnpx1=np.array([28.4,50.6,1011.9,80.54])x1=x1.reshape(1,4)R1=lr.
您可能关注的文档
- Python金融数据分析与挖掘(微课版) 课件 1-1. Python基本数据类型与基本数据结构.pptx
- Python金融数据分析与挖掘(微课版) 课件 1-2. Python公有方法.pptx
- Python金融数据分析与挖掘(微课版) 课件 1-3. Python基本数据结构方法.pptx
- Python金融数据分析与挖掘(微课版) 课件 2-1. 数组创建与操作.pptx
- Python金融数据分析与挖掘(微课版) 课件 2-2. 矩阵与线性代数运算.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-1.序列.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-2.数据框.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-3.外部文件读取.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-4.常用函数.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-5.常用计算任务.pptx
- 2025年中国呼吸系统药物行业发展前景预测及投资规划建议报告.docx
- 中国沙棘颗粒市场运行动态及行业投资潜力预测报告.docx
- 2025年中国白蛋白行业发展前景及投资战略规划研究报告.docx
- 河南安彩集团完整版招考聘用6人(高频重点提升专题训练)共100题附带答案完整题库含答案(培优).docx
- 河南安彩集团历年毕业生专项招聘生产储备岗100题模拟试题附带答案内部题库附答案【预热题】.docx
- 中国裙装行业发展潜力分析及投资方向研究报告.docx
- 2019-2025年中国泼尼松行业市场运营现状及投资规划研究建议报告.docx
- 应急预案事故风险评估报告.docx
- 2019-2025年中国服务业行业市场调查研究及投资前景预测报告.docx
- 2025年中国皮足球鞋市场竞争态势及行业投资潜力预测报告.docx
文档评论(0)