回归分析法..docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
回归分析法.

回归分析法 用相关系来表示变量x和y线性相关密切程度,那么r数值为多大时才能说明它们之间线性关系是密切的?这需要数理统计中的显著性检验给予证明。三、显著性检验 是来用以说明变量之间线性相关的密切程度如何,或是用以说明所求得的回归模型有无实用价值。为说明相关系数的概念,先观察图2-3。回归分析的检验包括:相关系数的显著性检验、回归方程的显著性检验、回归系数的显著性检等,它们是从不同角度对回归方程的预测效能进行验证的。 关于显著性检验 这涉及有关数理统计的内容,为此我们作一下简要回顾。 数理统计的主要内容包括: ·参数估计; ·假设检验; ·方差分析等。 (1)相关系数检验。相关系数的检验,需要借助于相关系数检验表来进行,这种表是统计学家按照有关的数学理论制定出的。在相关系数检验表中,有两个参数需要说明。 1)f —称为自由度。其含义为:如果有n个变量 x1,x2,...xn 相互独立,且无任何线性约束条件,则变量的自由度个数为 f=n ,一般情况下有:f=n — 约束条件式数 对于一元线性回归,参数a,b要通过观测数据求出,有两个约束式,则失去两个自由度,因此 f=n-2 ,n为散点(观测点或统计数据点)个数。 2) a —称为显著性水平。取值为0.01或0.05。而1-a 称为置信度或置信概率,即表示对某种结论的可信程度。当 a 取值为0.05时,则1-a 为0.95,这表示在100次试验中,约有5次犯错误(小概率事件发生)。 判断两个随机变量x,y间有无线性相关关系的方法是:首先根据要求确定某一显著性水平 a ,由散点数n计算出 f ,然后根据 a , f 利用相关系数检验表查出相关系数的临界值 ra ,最后将计算出的相关系数r的绝对值与临界值 ra 相比较。 ra 表示在一定的置信概率下,所要求的相关系数起码值。 若 ,表示这两个随机变量之间存在线性相关关系;若 ,表示这两个随机变量之间线性相关程度不够密切。也就是只有当 时,所建立的线性回归模型才有实际应用价值(即线性相关密切)。但应注意,两个随机变量之间没有线性相关关系,并不等于没有非线性相关关系。此外,x与y之间的线性关系还与样本n大小有关。 (2)回归方程检验。它是通过方差分析来解释回归方程中因变量变化随自变量的变化是否有效,是从方程总体上判别回归效果是否显著,其检验方法称F检验法。 将两个平方和 Q 、U进行对比,则形成另一个统计量为  (2-14) 式中 F —称为统计量(两个平方和之比); m—回归方程自变量个数,对一元回归,m=1; n—样本个数。 从上式对比关系分析 , 计算值越大,表明随机干扰性相对就弱,回归效果就越显著,反之回归效果差。 使用F检验法进行检验,需要借助于F检验表来进行。首先计算出F值;然后根据给定的显著性水平α,查F分布表,得临界值 Fa=(1,n-2) ;最后判别,若F ≥ Fa=(1,n-2),认为x与y之间存在显著的线性关系,或说回归效果显著;反之,则认为x与y之间线性关系不显著。此时,则不适宜采用此方法进行负荷预测。 为了理解相关系数r和统计量F计算公式,我们再分析一下各方差的特点。 其中, 是 这n个数据对 的离差平方和,将其展开为   (2-15) 上式中 则是 x1,x2,...xn 的离差平方 和。因为 的大小反映了x对y线性影响的大小,所以称为回归平方和。 而 ,实际它就是 。在一元线性回归模型的假设下, 纯粹是由随机误差引起的,它反映了除x对y的线性影响之外的一切因素对 的影响作用,所以称为剩余平方和。 此外,除了r和f检验外,还有回归系数显著性检验法,该检验法是用来判定回归方程中各个自变量的作用是否显著,即对方程结构进行检验,称为t检验法。对于一元回归,上述各检验法是等价的,采用其中一项即可,但对多元回归采用f检验法较为方便。t检验法常用于逐步回归分析。 例如,对例2-1的进行相关系数检验,计算相关系数为  取 a=0.05 , f=n-2=7-2=5 查相关系数检验表,得相应的 ra=0.775 。显然 r>ra ,这就表明国民收入和用电量存在线性相关关系,所建立的一元线性回归模型 yi=-2.1+2.97xi 有实用价值(线性关系密切) (3)置信区间 如上所述,利用回归模型预测,当给定某个自变量值,即可以得到一个确定的预测数值。但在实际工作中有意义的往往并不只是一个确定的数值,而是一个范围或区间则更有参考价值。在回归分析中恰恰有一个突出的优点,就是能够计算出以回归方程所估计的某个值为中心的预测区间,这个区间被称为置信区间。 置信区间是由标准偏差 来确定的,这个置信区间的上下限近似为  (2-16)  (2-17) 式中 —对应自变量x的计算值; yi—对应自变量x的实际统计值; n—散点数。 由式(2-17)

文档评论(0)

sdgr + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档