- 1、本文档共104页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R统计分析研讨
(2)标准化(内学生化)残差计算, rstandard() rstandard(lm32) (3)外学生化残差 rstudent(lm32) (4)残差图 以残差为纵坐标,拟合值或对应的数据观测序号i或观测时间为横坐标的散点图统称为残差图,它是进行模型诊断的重要工具 下面我们绘制第一组回归(拟合比较好,残差服从正态分布)lm1的残差图和标准化残差图 fit1=fitted(lm1) # predict(lm1) 也可以 # 残差图 r1=resid(lm1); plot(r1~fit1) # 标准化残差图 rst1=rstandard(lm1) plot(rst1~fit1) 对于标准化残差,应该有大约95%的样本落入[-2,2]之间; 则若拟合值hat(Y) 为横坐标,那么标准化残差大概落入[-2,2]内,且不呈现任何趋势,否则回归模型可能有问题 下面看第二组回归(曲线)lm2.可以看到,曲线回归后残差图变好 rst2=rstandard(lm2) fit2=fitted(lm2);plot(rst2~fit2) # 曲线回归 lm2curve=lm(Y2~X+I(X^2), data=Anscombe) rst2c=rstandard(lm2curve); fit2c=fitted(lm2curve) plot(rst2~fit2) (5)残差的QQ图 可以用QQ图检验残差的正态性 R中直接使用plot(lm,2)即可 如 plot(lm1,2) 3、影响分析 所谓影响分析就是探查对估计有异常大影响的数据(例如 第三组数据), 如果一个样本不遵守某个模型,但是其余遵守,称这个样本为强影响点(异常值点) 影响分析的重要功能就是区分这样的点 (1)帽子矩阵H的对角元素 若H的h(ii)元大于2*(p-1)/n,则第i组样本影响较大,计算H的对角元的函数为 hatvalues() (2) DFFITS 准则 dffits(),若超过2*sqrt((p+1)/n),则可能为异常值 (3)Cook统计量 cooks.distance(),Cook统计量越大的点可能是异常点 (4) COVARATIO 准则 covaratio(),偏离1越远,则认为哪个样本点的影响越大。 (5)总结 influence.measures()可以作为诊断分析的概括,返回每个样本 的dfbeta,diffit,cook等统计量,星号*是可能异常的点 influence.measures(lm3) Influence measures of lm(formula = Y3 ~ X, data = Anscombe) : dfb.1_ dfb.X dffit cov.r cook.d hat inf 1 -4.64e-03 -4.43e-02 -0.1468 1.34e+00 0.011831 0.100 2 -3.75e-02 1.88e-02 -0.0624 1.39e+00 0.002183 0.100 3 -1.83e+02 2.69e+02 342.7851 7.36e-10 1.392828 0.236 * 4 -3.31e-02 -2.66e-18 -0.0997 1.36e+00 0.005525 0.091 5 4.92e-02 -1.17e-01 -0.2197 1.34e+00 0.026072 0.127 6 4.90e-01 -6.67e-01 -0.7898 1.36e+00 0.300634 0.318 7 2.60e-02 -2.01e-02 0.0292 1.53e+00 0.000480 0.173 8 2.39e-01 -2.07e-01 0.2449 1.80e+00 0.033194 0.318 * 9 1.38e-01 -2.32e-01 -0.3365 1.34e+00 0.059650 0.173 10 -1.54e-02 1.05e-02 -0.0197 1.45e+00 0.000218 0.127 11 1.04e-01 -8.62e-02 0.1098 1.64e+00 0.006752 0.236 4、共线性,条件数,kappa()函数 当自变量彼此相关时,某变量可能会因为其它变量的改变 而改变其效应,甚至改变符号,自变量彼此相关称为共线性或多重共线性,若出现共线性,建议使用主成分回归 若存在某些常数c0,c1,c2使得线性等式 c1X
您可能关注的文档
- C02/CH4/H2中MOFs和COFs吸附分离性能的比较研讨.doc
- cell公布2013年度最佳论文crispr技术上榜研讨.ppt
- CGCS2000国家大地坐标系推广应用研讨.pptx
- CAN总线故障波形分析研讨.ppt
- CFA数量研讨.docx
- chapter16-催化剂表征分析技术和手段(自由介绍)研讨.ppt
- Contact Models研讨.docx
- clkx03研讨.ppt
- CNC操作研讨.ppt
- Cool_Edit_Pro软件详解研讨.ppt
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)