- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
论最小二乘法回归分析中的几个问题
回归分析方法是常用的数理统计方法,它用来处理变量之间的
相关关系,在科学研究、工程技术等各个领域均有广泛的应用。由于
回归分析是通过试验数据研究变量之间的相关关系,故使用此方法时,
需要判断相关关系是否密切(对回归方程进行显著性检验)。水文计
算的一些文献[1][ 2]中,指出相关系数的绝对值|r|>0.8作
为判别标准,而没有明确使用此标准的前提。另外,使用最小二乘估
计,有时尽管回归方程显著,但回归方程中回归系数的符号与实际问
题不符,即回归系数出现错误符号,显然这种情况下的回归方程是不
能使用的。本文针对相关系数的绝对值|r|>0.8判别标准的来
历以及回归系数错误符号的原因分析等进行论述,以期达到回归方法
的正确使用。
1 相关系数临界值0.8的来历
水文上,常用0.8作为判别相关关系是否密切的监界值。例
如文献[1][ 2]中均提到相关系数绝对值|r|>0.8时,认为相
关密切。事实上,这一标准是针对一元线性回归观察值组数n≥10
时的一种简便的判别方法,不具有普遍意义。若忽略了n≥10这一
条件,则可能会导致错误的结论。关于这一点可以从相关系数显著性
检验制成的相关系数临界值表中容易得到解释。
对于多元线性回归,F检验法的统计量F和复相关系数R分别
为[3]:
式中 n——观测数据组数
m—— 自变量个数
u——回归平方和
Q——残差平方和
设显著性水平为a、自由度为(m,n-m-1)的F检验法
的临界值为:Fa(m,n-m-1),并简记为Fa,利用式(1)(2)
可以导出F≥Fa等价于:
时相关系数灵敏检验法的临界值,以下简记为Ra。
当R≥Ra时,线性回归方程显著。
对于一元线性回归,令Ra(n-2)=ra,简单线性相关
系数r2=u/(Q+u),|r|=R,当|r|≥ra时,线性
回归方程显著。
对于Ra已制成相关系数检验临界值表 [3,4]。以一元线性
回归为便,由此表可得表1中的数据。
可见,当a=0.01,n=10,|r|≥0.765≈0.8,
回归方程效果显著。
由上表可知,当a=0.01,n≥10时,|r|>0.8>r
a。即n>10时,ra<0.8。在水文计算中回归分析用于插补
延长系列,从避免有较大误差提高设计成果精度的角度,将n≥10
时|r|>0.8作为相关密切的简易判别标准。但绝不能不问n等
于多少,而笼统地认为只要|r|>0.8,则相关密切。
同时,还应注意,相同a相关系数临界值Ra将随自变量个数
m的增大而增大。便如对于三元线性回归,当n=10时,由文献[4]
中相关系数临界值表可查得a=0.01时,R0.01=0.911。
切忌不分具体情况,一概而论,盲目使用|r|>0.8的判别标准。
2 回归系数错误符号的原因及分析方法
为讨论方便,需引进一般多元线性回归模型
通常称X为多元回归模型的设计阵。
最小二乘原则确定回归系数具有良好的性质,例如当假设ε~
N(0,σ2)时,可对回归方程进行显著性检验,经验回归系数是
理论回归系数的无偏估计量等。但最小二乘估计有时会出现某些自
量的回归系数的符号与实际问题不符的不合理现象,以下实例就说明
了这一点。
某承压水漏斗区漏斗中心历年最低水位、历年开采量资料见表
2。漏斗中心最低水位出现在每年6月底、7月初。利用水均衡方程
分析表明,影响第t+1年漏斗中心最低水位的主要因素为第t年漏
斗中心最低水位和第t年漏斗区开采量。根据1976~1995年
数据建立线性回归方程为:
h(t+1)=0.8963 h(t)+0.0150 Q(t)-
9.3952 (5)
式中h(t)、h(t+1)分别为第t年、第t+1年漏斗
中心年最低水位m; Q(t)为第t年年开采量,106m3。
从物理成因上分析容易得出,开采量对漏斗中心最低水位的影
响为负相关,即开采量越大,漏斗中心水位越低,但回归方程中Q(t)
的系数却为正值,显然是不合理的。尽管式(5)经过显著性检验回
归效果显著(复相关系数R=0.969,相关系数临界值R0.01
=0.662),但这样的模型是不符合实际的。
为什么回归系数会出现错误符号理论分析[5]和实践均表明,
当设计阵X接近奇异时,正规方程组的唯一解虽然存在,但最小二乘
您可能关注的文档
最近下载
- 小学英语自然拼读法基本规则.doc VIP
- 肿瘤内科护理常规.pdf VIP
- 消防设施通用规范GB 55036-2022与《消防给水及消火栓系统技术规范》GB 50974-2014失效条款对比分析.pdf VIP
- 《预防导尿管相关尿路感染(CAUTI)指南2025》解读(2).docx VIP
- 船员起居舱室.pdf VIP
- 慢性肾脏病PPT【71页】_20212085.pptx VIP
- 《闻鸡起舞》儿童绘本成语故事演讲ppt课件(图文).pptx VIP
- 6.13 中国华能集团公司电力安全生产奖惩办法 .pdf VIP
- 山西汾酒-市场前景及投资研究报告-汾酒复兴进阶.pdf VIP
- 中建一局集团公司总承包公司质量管理手册(2013版)(OCR).pdf VIP
原创力文档


文档评论(0)