- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一元,多元线形回归分析:
一. 请分别叙述变量间统计关系与函数关系的区别,以及相关分析与回归分析的联系与区别。
答:各自然现象或社会现象之间普遍存在着各种联系,根据这些联系的紧密程度不同,可将之分为函数关系与统计关系。
一种情况下某变量Y能被其余的一类变量完全决定,这时两者之间存在着完全的确定性关系,这种关系可以通过一个函数 表示。这样的确定性关系被称为函数关系。
另一种情况下变量之间虽然存在紧密的联系,但并不能互相唯一确定,这种非确定性的紧密联系被称为统计关系。
相关分析与回归分析都是研究两边统计关系的方法,在实际问题的处理中往往结合使用两者。两者的区别主要在于:1.目标不同:相关分析主要用于刻画X,Y两变量间的联系的密切程度,而回归分析除此之外,还关心对未观察Y值的预测与控制。2.角度不同:相关分析中X,Y两变量地位相同,因此假设两者都是随机变量;而回归分析中只将变量Y作为主要研究对象,因而往往假设Y是随机变量,而X是非随机变量。
二. 请叙述(一元)多元线性回归模型及其基本假设
答:1.一元线性模型的基本形式是:
,其中称为回归系数,称为随机误差。
其基本假设为:
G-M假设:
或者更强的正态性假设:
独立同分布, 。
2.多元线性模型的基本假设是:
称为回归系数阵,称为随机误差.
其基本假设为:
a. G-M假设:
或者更强的正态性假设:
独立同分布, 。
b.rank(X)=p+1n
三. 请叙述最小二乘法(最大似然法)的基本思路、理论基础与性质,并对两者作比较。
答:
最小二乘法的基本思路是通过最小化残差平方和
求得回归系数的估计值。其理论基础是函数极值理论。
2.最大似然法的基本思路是最大化似然函数
求得回归系数的估计值。其理论基础是函数极值理论。
3.两者对的估计结论是一致的,且结果均具有线性,无偏性,稳定性(在G-M假设下是最小方差线性无偏估计,在正态性假设下是最小方差无偏估计,具体参见问题四)。
4.相对来说,使用最大似然法需要的假设较强,需要正态性假设,而最小二乘法本身不需要任何假设。但是,最大似然法可以得到的估计,而最小二乘法不行。
四. 假设通过最小二乘估计得到回归方程 的估计,请叙述估计量以及残差的定义及其性质。
答:1.估计量具有线性,无偏性,稳定性,即:
a. 是y的线性变换
b. 是无偏的。
c.在G-M假设下是最小方差线性无偏估计,在正态性假设下是最小方差无偏估计。。
残差,它具有以下性质
a.
b. ,即
c.
d. ,且正态性假设下两者独立
e.服从自由度为n-p-1的开方分布,即
五、叙述多元线性回归中常见的显著性检验方法及其关系。
答:常见的显著性检验方法有t检验,F检验,偏F检验三种。假设检验水平为。
1.F检验
检验统计量:
判断法则:时拒绝原假设。
2.t检验
检验统计量:
判断法则:时拒绝原假设。
3.偏F检验
检验统计量:
判断法则:时拒绝原假设。
4.三者的关系。
t检验与偏F检验等价,F检验与另两者不同(实质上是另两者的前提),通常先做F检验,再做t检验或偏F检验。
六、给出一元回归模型估计值的点估计与区间估计(置信度)
答:1.在未观测点处,y的点估计为。
2.在未观测点处,的区间估计为(预测区间)
n相当大时(n15),可以简化为。
3. 在未观测点处,的区间估计为(置信区间)
。
给定置信上界与置信下界时,的取值范围为
七.叙述样本数据与回归系数标准化的意义与方法
答:多元线性回归模型中,由于自变量的数量级差异较大,因而舍入误差将对估计的精度造成较大的影响;同时自变量的单位不同也会造成回归方程的解释比较困难,因而通常需要对样本数据进行预处理,即数据的标准化。
数据的标准化通常这样进行:
利用标准化样本数据的得到的回归方程系数称为标准化回归系数,其满足:
.
八.给出偏决定系数、偏相关系数的定
文档评论(0)