- 1、本文档共77页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
简单回归讲述
第三节 残差分析 残差(residual)是指观测值Yi与回归模型拟合值之差 残差分析(residual analysis)旨在通过残差深入了解数据与模型之间的关系,评价实际资料是否符合回归模型假设,识别异常点等。 例如,第一数据点的残差e1=14-14.0957=-0.0957,如此类推,计算出各数据点的残差值示于表12-2的第10列中。将第10列的残差减去其均数,除以其标准差,便得标准化残差。 若以反应变量取值Yi为横坐标,以标准化残差为纵坐标,构成的散点图如图12-7所示。类似地,也可以自变量取值Xi为横坐标, 以标准化残差为纵坐标,构成的散点图。这类散点图统称为标准化残差图。 残差图中绝大多数散点在±2倍标准差之间,在0为参考线的上下随机均匀散步时,可认为模型拟合较好 在±3倍标准差以外的点为离群点 在±2倍和±3倍标准差之间的点可能为离群点 直线回归应用的注意事项 直线回归用于定量刻画应变量Y对自变量X在数值上的依存关系,其中应变量的定夺主要依专业要求而定,可以考虑把易于精确测量的变量作为X,另一个随机变量作Y,例如用身高估计体表面积。 两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归分析。 1.根据分析目的选择变量及统计方法 2.进行回归分析前应绘制散点图 (1) 散点图可考察两变量是否有直线趋势; (2) 可发现异常点(outlier)。 散点图对异常点的识别与处理需要从专业知识和现有数据两方面来考虑,结果可能是现有回归模型的假设错误需要改变模型形式,也可能是抽样误差造成的一次偶然结果甚至过失误差。需要认真核对原始数据并检查其产生过程认定是过失误差,或者通过重复测定确定是抽样误差造成的偶然结果,才可以谨慎地剔除或采用其它估计方法。 3.资料的要求 直线回归要求至少对于每个 X 相应的 Y 要服从正态分布,X可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量; * 对于双变量正态分布资料,根据研究目的可选择由 X 估计 Y 或者由 Y 估计 X ,一般情况下两个回归方程不相同)。 反应两变量关系密切程度或数量上影响大小的统计量应该是回归系数的绝对值,而不是假设检验的P值。 P值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著”。另外,直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围。“只能内插,不能外推” 4.结果解释及正确应用 当实际资料不能满足直线回归模型的要求而无法用最小二乘法估计回归方程时,可使用秩回归 直线回归与相关的区别与联系 区别 r 没有单位,b有单位;所以,相关系数与单位无关,回归系数与单位有关; 相关表示相互关系,没有依存关系;而回归有依存关系; 对资料的要求不同: 当X和Y都是随机的,可以进行相关和回归分析; 当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析 直线回归与相关的区别与联系 联系 均表示线性关系; 符号相同:共变方向一致; 假设检验结果相同:是否存在共变关系; 某医师为了研究正常成年男子运动后最大心率和年龄的关系,测得10名成年男子的有关数据见下: 10名正常男子最大心率(次/分钟)和年龄(岁)的测定结果 样本号 年龄(x) 最大心率(y) 1 45.00 164.00 2 35.00 185.00 3 37.00 186.00 4 44.00 167.00 5 47.00 142.00 6 49.00 150.00 7 47.00 147.00 8 47.00 153.00 9 42.00 167.00 10 41.00 170.00 若散点图呈线性趋势,建立回归方程, , 经假设检验P<0.001。请解释回归系数的意义。 (2)对该回归方程进行假设检验的方法有哪些? (3)作线性回归分析的前提条件是什么? 某医院测量了10名3岁男童体重(X,Kg)与体表面积(Y,103cm2),数据见表 10名3岁男童体重(X,Kg)与体表面积(Y,103cm2) 编号 1 2 3 4 5 6 7 8 9 10 体重 X 11.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 16.0 体表面积Y 5.283 5.299 5.358 5.292 5.602 6.014 5.830 6.102 6.075 6.411 若X、Y的散点图有直线趋势, 直线回归方程为 (1)请具体回答上述直线回归方程中回归系数b的统计学意义 (2)对该回归方程进行假设检验的方法有哪些? (3)如何评价回
文档评论(0)