- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十二章 回归分析 回归的概念 “回归”一词始于英国统计学家Galton, 他Pearson研究了儿子身高Y与父母亲平均身高X之间的关系,并用一条直线描述Y和X之间的关系。 y^=84.33+0.516x 个子高的父亲有生高个子儿子的倾向,同样地,个子矮的父亲有生个子矮儿子的倾向,但是高的不可能伸进天,低的不可能缩入地。他同时又发现某人种的平均身高是相当稳定的。最后得到结论:子代的身高回复于全体男子的平均身高,即“回归”——见1889年F.Galton的论文《普用回归定律》。 现在回归已远非其本意,已经成为探索变量之间关系最重要的方法之一,用以找出变量之间关系的具体表现形式。 回归分析 相关系数--双向关系 回归方程--单向关系 一元线性回归 一元线性回归方程的检验 一元线性回归方程的应用 多元线性回归简介 一元线性回归 一元线性回归是指只有一个自变量的线性回归(linear regression)。 回归线(regression line) 一条最能代表散点图上分布趋势的直线,这条最优拟合线即称为回归线。 常用的拟合这条回归线的原则,就是使各点与该线纵向距离的平方和为最小。 回归线 回归线 回归线 回归线 回归方程 确定回归线的方程称回归方程。 回归方程的建立 用最小二乘方法求回归系数(regression coefficient) 与相关系数 r 比较 由Y估计X 偏回归系数的性质 偏回归系数的解释 Y的单位改变,回归系数如何变? X的单位改变,回归系数如何变? 通过Y预测X时,bxy为byx的倒数? 偏回归系数与相关系数的关系。 一元线性回归方程的显著性检验 三种等效的方法: 对回归方程进行方差分析 对两个变量的相关系数进行与总体零相关的显著性检验; 对回归系数进行显著性检验。 测定系数 回归平方和(regression sum of squares, explained ~) 残差平方和(residual sum of squares, error ~, unexplained ~) 测定系数 测定系数(coefficient of determination)指回归平方和在总平方和中所占比例,这个比例越大,意味着误差平方和所占比例越小,预测效果就越好。 测定系数等于相关系数的平方(相关系数的解释)。 对回归方程的方差分析 方差来源 平方和 自由度 均方差 F 值 回归 SSR 1 MSR MSR/MSE 残差 SSE n - 2 MSE 总差异 SST n - 1 回归系数的显著性检验 估计误差的标准差 由于与 X 各点相对应的诸 YX 值之平均数和标准差均为未知,故估计误差的标准差只能从样本加以估计。其无偏估计量为: 对回归系数进行显著性检验 在回归线上,当与所有自变量X相对应的各组因变量Y的残值都呈正态分布,并且残值方差为齐性时,可以用以下公式进行显著性检验。 公式 一元线性回归方程的应用 用样本回归方程推算因变量的回归值 点估计:语文成绩为80分的学生的智商是多少? 区间估计:体重为20千克的男童的简单反应时95%的置信区间 =(550±1.96×93.67)=(550±183.6) 或(366.4,733.6) 一元线性回归方程的应用 对因变量真值的预测 回归方程是由样本数据列出的,由于抽样误差的影响,其回归值并不是因变量的真值。要预测其真值还需考虑到各样本回归方程之间的变异。 对因变量真值的预测 二元线性回归方程 二元线性回归方程是指一个因变量Y与两个自变量X1与X2之间建立的线性回归方程。 二元线性回归方程也用最小二乘法来确定回归系数。 式中各个L都是相应的离差平方和或离差乘积和 二元线性回归方程的偏回归系数 标准回归方程和标准回归系数 偏回归系数的解释(自变量单位的影响) 为了比较自变量在估计预测因变量时所起作用的大小,需要将自变量和因变量分别转换成标准分数,然后比较由标准分数所建立的标准回归方程中的两个标准回归系数,根据标准回归系数的绝对值大小来判断自变量作用的大小。绝对值大的作用大。 二元线性回归的检验 二元线性回归的检验 检验回归方程的显著性 检验两个偏回归系数的显著性 二元线性回归的检验 二元线性回归方程的显著性检验方法: 方差分析 复相关系数(multiple correlation coefficient)显著性检验。 复相关系数表示两个自变量组合起来与因变量之间的相关程度。可通过对二元测定系数开平方根得到,然后通过查表进行显著性检验。 二元线性回归的检验 偏回归系数(partial regression coefficient)的显著性检验
原创力文档


文档评论(0)