第二篇 回归分析与相关分析作业
第二篇 回归分析与相关分析
第二篇作业题
⒈ 证明题
⑴ 试证
① ;
② 。
证:① 展开x、y的校正交叉乘积和可得
,
展开分母中的一部分即x的校正平方和得到
,
同理,展开y的校正平方和得到
.
下面的结果显而易见。
② 根据上面展开的结果,容易得到
.
⑵ 假定的反函数为,试证。
证明:对于,我们有
;
完全类似,对于,可知
。
因此
。
⑶ 试证明
。
证明:根据下式
,
可知
.
因此,对于一元线性回归
.
⑷ 试证明
。
证明:根据定义
.
考虑到,以及
.
应有
.
从而
.
比较F和t的表达容易看出
.
⑸ 我们知道,一元线性方程的回归系数b和相关系数R可以表作
,,
式中
,
分别为x和y的校正平方和。要求:
① 建立回归系数和相关系数的关系。
证明:显然关系如下
。
② 证明对于标准化的x和y值,必有。
提示:数据标准化的公式为
()
式中
为平均值,而
为基于抽样方差的标准差。
证明:我们知道,对于标准化数据,均值为0,方差为1。根据数据标准化公式和校正平方和的定义
,
同理可得
。
将这些结果代入R与b的关系式,立即得到
。
(6)VIF计算公式的证明,
以二元线性回归为例,证明如下问题。
① 对于标准化的自变量,建立矩阵X*,则
为自变量x1和x2的简单相关系数矩阵。
② C的逆矩阵
的对角线的元素等于方程膨胀因子(VIF)值。
证明:
① 参见第2章和关于因子分析一章的有关内容。
② 相关系数矩阵表作
,
根据相关系数的性质,式中
, .
于是C的逆矩阵可以写作
,
根据线性代数知识可知,式中C矩阵对应的行列式为
,
C的伴随矩阵为
.
所以逆矩阵为
.
显然
,.
⒉ 计算题
为了估计山上积雪溶化后对河流下游灌溉的影响,在山上建立观测站,测得连续10年的观测数据如下表(见下表1-1)。
表1-1
年 份 最大积雪深度x(米) 灌溉面积y(千亩) xi2 yi2 xiyi 预测值 残 差 1971 15.2 28.6 1972 10.4 19.3 1973 21.2 40.5 1974 18.6 35.6 1975 26.4 48.9 1976 23.4 45.0 1977 13.5 29.2 1978 16.7 34.1 1979 24.0 46.7 1980 19.1 37.4 ∑
利用本节公式,借助Excel计算:
① 表中各项指标;
② 回归参数a、b,并给出回归模型;
③ 计算总平方和SSt即Syy、剩余平方和SSe及回归平方和SSr;
④ 验证如下关系
,,,.
⑤ 验证如下关系:SSt=SSr+SSe,即
.
⑥ 相关系数R和标准误差s;
⑦ 计算F值、t值和DW值;
⑧ 计算残差与自变量的相关系数,分析结果。
⑨ 假定1981的积雪深度为27.5米,估计当年的灌溉面积大约为多少?
⒊ 多元回归分析
⑴ 为了考察工业、农业和固定资产投资对交通运输业的影响,利用SPSS统计分析软件对某省1970-1987年18年的产值数据进行多元回归分析和逐步回归分析,指出多重共线性的问题实质所在(见下表1-2)。
表1-2
序号 年份 工业产值x1 农业产值x2 固定资产投资x3 运输业产值y 1 1970 57.82 27.05 14.54 3.09 2 1971 58.05 28.89 16.83 3.40 3 1972 59.15 33.02 12.26 3.88 4 1973 63.83 35.23 12.87 3.90 5 1974 65.36 24.94 11.65 3.22 6 1975 67.26 32.95 12.87 3.76 7 1976 66.92 30.35 10.80 3.59 8 1977 67.79 38.70 10.93 4.03 9 1978 75.65 47.99 14.71 4.34 10 1979 80.57 54.18 17.56 4.65 11 1980 79.02 58.73 20.32 4.78 12 1981 80.52 59.85 18.67 5.04 13 1982 86.88 64.57 25.34 5.59 14 1983 95.48 70.97 25.06 6.01 15 1984 109.71 81.54 29.69 7.03 16 1985 126.50 94.01 43.86 10.03 17 1986 138.89
原创力文档

文档评论(0)