- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章 线性相关与回归.ppt
相关与回归 * 二、回归方程参数的计算 最小二乘法原则(least square method):使各散点到直线的纵向距离的平方和最小,即使 最小。 因为直线一定经过“均数”点 相关与回归 * 根据上例的数据,求男青年身高与前臂长之间的回归方程。 从相关系数的计算中,已经求得: ∑X=1891 ∑Y=500 ∑ X2=89599 ∑ Y2=22810 ∑XY=86185 N=11 相关与回归 * 这就是我们求得的二者关系的回归方程 相关与回归 * 回归直线的描绘 根据求得的回归方程,可以在自变量X的实测范围内取一个x1(较小值)和x2(较大值)两值,代入回归方程中,求得相应的两个Y值,以这两对数据找出对应的两个坐标点,将两点连接为一条直线,就是该方程的回归直线。回归直线一定经过( )。可以用来核对图线绘制是否正确。 相关与回归 * 相关与回归 * 与直线相关一样,直线回归方程也是从样本资料计算而得的,同样也存在着抽样误差问题。所以,需要对样本的回归系数b进行假设检验,以判断b是否从回归系数为零的总体中抽得。为了判断抽样误差的影响,需对回归系数进行假设检验。总体的回归系数一般用β表示。 相关与回归 * 1.方差分析 F=MS回归/MS误差 2.t检验 回归系数的假设检验 H0:β=0 H1:β≠0 α=0.05 选择合适的假设检验方法,计算统计量 计算概率值P 做出推论:统计学结论和专业结论 相关与回归 * 三、回归参数的假设检验 b≠0原因:① 由于抽样误差引起,总体回归系数 β=0 ② 存在回归关系,总体回归系数 β≠0 公式 ,υ=n-2 Sb为回归系数的标准误 SY|X为Y的剩余标准差——扣除X的影响后Y的变异程度。 (一) t 检验; (二) 方差分析 相关与回归 * 剩余(残差)标准差 SY|X 度量了实际散点远离回归直线的离散程度,反映了模型的可靠性。越小模型越好。 tb检验,区间的计算均需要使用这一值。 相关与回归 * 斜率b的假设检验 H0: ? = 0 H1: ? ? 0 ? ? 0.05 自由度 ? 11 - 2 =9 检验统计量: 按?=0.05检验水准, P0.05,拒绝H0,认为男青年身高与前臂长之间存在线性回归关系。 注意:对于同一资料,tb=tr,检验完全等价 相关与回归 * X 相关与回归 * Y的离均差平方和的分解 相关与回归 * 几个平方和的意义 相关与回归 * 再看公式: 相关与回归 * 表1 回归效应的整体方差分析表 变异来源 ν SS MS F值 P值 回归 1 47.042 47.042 14.702 0.005 残差 9 27.164 3.018 总变异 10 69.636 按?=0.05检验水准, P0.05,拒绝H0,认为男青年身高与前臂长之间存在线性回归关系。 相关与回归 * 直线回归的应用 ?描述两变量之间的依存关系:通过回归系数的假设检验,若认为两变量之间存在直线回归关系,则可用直线回归来描述。例如上例回归方程: 就是男青年身高与前臂长之间的定量表达式 。 ?利用回归方程进行预测 :把自变量代入回归方程,对应变量进行估计,可求出应变量的波动范围。例如,已知某男青年的身高,代入回归方程,再用区间估计的方法,即可知道男青年前臂长的范围。 ?利用回归方程进行统计控制 ?利用多元回归描述多因素的影响 相关与回归 * 3.利用散点图 对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再进行相关回归分析。 4.变量范围 相关分析和回归方程仅适用于样本的原始数据范围之内,出了这个范围,我们不能得出两变量的相关关系和原来的回归关系。 相关与回归 * 区别: 第三节 直线回归与相关的区别与联系 1. 适用资料类型: 回归: Y正态随机变量,X为可以精确测量的值 相关: X、Y服从双变量正态分布 2.应用 : 回归 ——数量依存关系,由一个变量值推算另一个变量值,
文档评论(0)