- 1、本文档共74页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第12章 简单线性回归
对于考察变量与变量之间关系时,我们采用回归分析的方法建立模型或方程进行变量间关系的分析。 因变量:被预测的变量 自变量:进行预测的变量 简单线性回归模型(对总体而言) 为未知参数, 为随机误差项,反映其它未列入回归模型的变量对因变量的影响。 关于简单线性回归模型的标准假设: 1. ,可推知, 该方程称为回归方程。 2. 对于所有的X,误差项 的方差 一样:即同方差假定。 3.误差项 独立。其协方差为零, 4.自变量是给定的变量,与误差项线性无关。 5.误差项 服从正态分布,从而说明Y服从正态分布 对于总体的线性回归模型,由于总体参数未知,我们只能利用样本数据进行估计,得到样本回归模型(对样本而言)。 分别为 的估计。 其中真实值与估计值之间的差距用e来表示: 是y的一个估计值。 我们称下式为估计回归方程: 估计回归方程与总体回归模型之间的区别。 总体回归模型是未知的,它只有一个。而估计回归方程则是根据样本数据拟合的,每抽取一组样本,便可以拟合一个样本估计方程。 总体回归模型中的?1和?2是未知的参数,表现为常数。而回归估计方程中的 和 是随机变量,其具体数值随所抽取的样本观测值不同而变动。 总体回归模型中的E是Y 与未知的总体回归线之间的纵向距离,它是不可直接观测的。而样本回归模型中的e 是Y 与估计回归线之间的纵向距离,当根据样本观测值拟合出估计回归方程之后,可以计算出e 的具体数值。 最小二乘估计法 该法的目的:使残差平方和达到最小 残差:因变量y的观察值与估计值之间的距离 求该式对应的b0,b1 可以根据微分的方法求解最优解。 令 披萨连锁店的销售量与学生人数的回归方程 模型的拟合度 判定系数:用来判断估计回归方程的拟合程度。 误差平方和SSE 总平方和SST 回归平方和SSR SST=SSR+SSE 判定系数 SST=SSR+SSE WHY? 在该披萨店的例题中,由样本估计得到的回归方程的判定系数为:0.9027 我们认为:该估计回归方程 有90.27%的总平方和可以通过估计回归方程来解释,我们认为该模型较好的拟合了学生人数与销售额之间的线性关系。 判定系数与相关系数的关系: 从而有: 判定系数=SSR/SST= 回忆相关系数的计算公式: 本例中:r=0.9501 模型的显著性检验 在模型进行估计以后,得到了估计回归方程。由于估计回归方程是由样本信息得到的,具有随机性。为了由样本推及总体,我们需要对估计参数进行显著性检验。因此可以利用之前介绍的假设检验的统计方法来判断。 1.估计回归模型中残差项的方差 之前的假设中,令误差项 的方差记为 可得, 因此 也代表了y值的方差。 数学上可以证明,方差 的无偏估计为MSE(mean square error) 其中SSE的自由度为n-2,受两个约束(b0,b1) MSE=SSE/(n-2) s称为估计量的标准误差 pizza店的例子中,计算得到SSE=1530, 因此方差 的一个无偏估计, 2.T检验及相应的抽样分布 T检验: 用来判定 是否显著为零。 H0: =0;Ha: ≠0 如果x和y相关,则有 ≠0. 如果通过假设检验,我们拒绝了H0,可以相应得到 ≠0的结论。 由于 是唯一的,是未知总体的参数,我们需要借助样本计算得到的斜率b1来进行判断。 考察b0,b1的抽样分布: 可以证明,在标准假定能够得到满足的条件下,回归系数的最小二乘估计量的期望值等于其真值,即有: 我们给出截距项估计参数的推导公式: 以上公式的推导,是由于: 令 推导: 由于总体方差未知,我们用之前说过的MSE来渐近估计总体方差: 代入估计参数的方差和标准差公式: 构造统计量T, 在H0为真是,T统计量服从自由度为(n-2)的t分布。 显著水平α下的拒绝规则:如果Tt(a/2;n-2),拒绝H0的初始假定。说明 显著非零。 披萨店的例子,我们来看人数的估计参数是否显著,也就是看学生人数是否真的与销售量有显著关系:显著水平为0.01 H0: =0;Ha: ≠0 在H0为真的前提下,有统计量T服从自由度为8的t分布。 比较T与临界值t(0.005,8),T3.36 从而可以拒绝H0的假定,统计上提供依据可以认为学生人数与披萨店的销售量有显著相关关系。 3.F检验及相关抽样分布
您可能关注的文档
- 第03章_典型相关分析.ppt
- 第04章 绘制基本的图形.ppt
- 第03章 立体的投影.ppt
- 第04章 大气污染浓度估算模式08.ppt
- 第04章基本控制结构与导出数据类型.ppt
- 第04节 若干初等函数类.ppt
- 第04章:极小值原理及其应用.ppt
- 第05章 中断系统-01.ppt
- 第05章 指令系统.ppt
- 第05章 递归与广义表.ppt
- 2023年黑龙江省鹤岗市工农区育才街道招聘社区工作者真题及参考答案详解一套.docx
- 2023年黑龙江省黑河市北安市主星乡招聘社区工作者真题含答案详解.docx
- 2023年黑龙江省绥化市海伦市联发乡招聘社区工作者真题及答案详解1套.docx
- 2023年黑龙江省绥化市安达市中本镇招聘社区工作者真题及参考答案详解.docx
- 2023年黑龙江省绥化市庆安县新胜乡招聘社区工作者真题及完整答案详解1套.docx
- 2023年黑龙江省绥化市安达市红旗泡水库管理所招聘社区工作者真题及参考答案详解.docx
- 2023年黑龙江省鹤岗市萝北县鹤北林业局招聘社区工作者真题及参考答案详解.docx
- 2023年黑龙江省鸡西市城子河区长青乡招聘社区工作者真题参考答案详解.docx
- 2023年黑龙江省绥化市青冈县种马场招聘社区工作者真题及完整答案详解1套.docx
- 2023年黑龙江省绥化市明水县树人乡招聘社区工作者真题及完整答案详解1套.docx
文档评论(0)