- 1
- 0
- 约6.53千字
- 约 14页
- 2026-02-02 发布于四川
- 举报
多元统计分析期末试题与答案
一、(25分)某市环保局在6个监测点同步采集空气样本,测得PM2.5(μg/m3)、NO?(μg/m3)、SO?(μg/m3)、O?(μg/m3)4项指标,数据经标准化后得到样本协差阵
S=?1.000.720.41?0.55?
?0.721.000.38?0.48?
?0.410.381.00?0.26?
??0.55?0.48?0.261.00?
(1)求S的特征值与单位特征向量,并给出第一主成分的表达式及其方差贡献率;
(2)若第二主成分解释为“光化污染因子”,请给出其表达式并解释符号含义;
(3)假设第i个监测点在第一、二主成分上的得分分别为y??、y??,写出该点综合得分z?=0.6y??+0.4y??的方差Var(z?),并说明为何该方差与监测点i无关;
(4)若只保留前两个主成分,求PM2.5的共性方差(communality)并解释其统计意义;
(5)现新增第七个监测点,其标准化观测x?=(2.1,1.3,?0.8,?1.5)?,计算该点在前两个主成分上的得分,并在主成分平面上判断其是否属于95%置信椭圆(椭圆半径χ2?,0.95=5.99)。
【答案与解析】
(1)特征方程|S?λI|=0展开得四次多项式
λ??3.34λ3+3.56λ2?1.39λ+0.17=0
数值解(保留两位小数)
λ?=2.42,λ?=0.78,λ?=0.34,λ?=0.46
对应单位特征向量
e?=(0.54,0.51,0.36,?0.59)?
e?=(?0.35,?0.31,0.87,0.19)?
e?、e?略。
第一主成分
y?=0.54·PM2.5+0.51·NO?+0.36·SO??0.59·O?
方差贡献率=λ?/tr(S)=2.42/4=60.5%
(2)第二主成分
y?=?0.35·PM2.5?0.31·NO?+0.87·SO?+0.19·O?
PM2.5、NO?系数为负,表明高“光化污染因子”对应一次污染物浓度低;SO?系数最大且为正,说明该因子主要反映燃煤排放的SO?富集,而O?系数较小且为正,暗示二次光化生成尚不明显,故命名为“光化污染因子”。
(3)令y=(y?,y?)?,则Var(y)=diag(λ?,λ?),于是
Var(z?)=0.62λ?+0.42λ?+2·0.6·0.4·Cov(y?,y?)
由于主成分彼此正交,Cov=0,故
Var(z?)=0.36·2.42+0.16·0.78=0.87+0.12=0.99
该方差仅由主成分方差与权重决定,与具体监测点i无关,体现主成分得分是线性投影,其方差为常数。
(4)共性方差即变量被公共因子解释的部分。对PM2.5,
h2_PM2.5=a??2+a??2=(0.54)2+(?0.35)2=0.292+0.122=0.414
表明41.4%的PM2.5方差可由前两个主成分解释,剩余58.6%为特殊因子及测量误差。
(5)得分
y??=e??x?=0.54·2.1+0.51·1.3+0.36·(?0.8)?0.59·(?1.5)=1.13+0.66?0.29+0.89=2.39
y??=e??x?=?0.35·2.1?0.31·1.3+0.87·(?0.8)+0.19·(?1.5)=?0.74?0.40?0.70?0.29=?2.13
马氏距离
D2=y??2/λ?+y??2/λ?=2.392/2.42+(?2.13)2/0.78=2.36+5.82=8.18
8.185.99,故该点落在95%置信椭圆外,视为异常高污染事件。
二、(20分)对某电商平台上400种商品测得价格x?(百元)、销量x?(千件)、评分x?(5分制)、退货率x?(%)。假设x=(x?,x?,x?,x?)?服从N?(μ,Σ)。现随机抽取n=100条记录,算得
x?=(3.2,5.1,4.3,2.8)?,
S=?0.64?0.810.220.15?
??0.812.25?0.35?0.28?
?0.22?0.350.490.11?
?0.15?0.280.110.36?
(1)写出HotellingT2统计量公式,并计算检验H?:μ=μ?=(3.0,5.0,4.0,2.5)?的T2值;
(2)给出α=0.05下的临界值,并给出结论;
(3)若拒绝H?,用Bonferroni法同时检验每个分量,指出哪些分量显著偏离;
(4)计算μ的95%联合置信椭球在(x?,x?)平面上的投影边界方程;
(5)若仅关心“价格—销量”二维子向量,求其95%置信域面积,并解释面
原创力文档

文档评论(0)