2026年大学统计学期末考试题库及答案——多元统计分析应用实例分析试题.docxVIP

  • 0
  • 0
  • 约8.29千字
  • 约 20页
  • 2026-02-02 发布于四川
  • 举报

2026年大学统计学期末考试题库及答案——多元统计分析应用实例分析试题.docx

2026年大学统计学期末考试题库及答案——多元统计分析应用实例分析试题

【试题1】

背景:某省卫健委为评估“社区健康干预”效果,在2025年对12个地级市同时采集了7项指标:

X?:人均公共卫生经费(千元)

X?:每万人全科医生数

X?:高血压规范管理率(%)

X?:糖尿病规范管理率(%)

X?:15岁以上人群吸烟率(%)

X?:人均食盐摄入(g/d)

X?:PM?.?年均浓度(μg/m3)

数据经标准化后得到样本协方差矩阵S(单位已去除):

```

S=

[[1.00,0.82,0.75,0.70,?0.55,?0.48,?0.42],

[0.82,1.00,0.78,0.73,?0.58,?0.51,?0.45],

[0.75,0.78,1.00,0.85,?0.62,?0.55,?0.50],

[0.70,0.73,0.85,1.00,?0.60,?0.53,?0.48],

[?0.55,?0.58,?0.62,?0.60,1.00,0.65,0.58],

[?0.48,?0.51,?0.55,?0.53,0.65,1.00,0.62],

[?0.42,?0.45,?0.50,?0.48,0.58,0.62,1.00]]

```

(1)求S的前两个主成分Y?、Y?,并解释其现实意义。

(2)若用Y?、Y?作为自变量,以“干预后心脑血管事件下降率”Z(%)为因变量,建立回归方程。12地市的(Y?,Y?,Z)观测值为:

(2.3,?0.8,15.2),(1.9,?0.5,13.7),(2.1,?0.7,14.5),(1.5,0.2,11.0),

(0.9,0.6,8.3),(0.5,0.9,6.1),(0.2,1.1,4.8),(?0.3,1.4,2.5),

(?0.7,1.6,0.9),(?1.1,1.8,?0.8),(?1.4,2.0,?2.1),(?1.8,2.2,?4.0)

求标准化回归系数,并检验整体显著性(α=0.05)。

(3)若将12市按Y?+Y?1.5归为“高健康水平组”,否则为“低健康水平组”,用Fisher线性判别函数建立分类规则,并计算留一法交叉验证误判率。

【答案与解析】

(1)对S求特征值与特征向量,得

λ?=4.31,对应单位特征向量

e?=(0.40,0.41,0.42,0.41,?0.36,?0.33,?0.30)?

λ?=1.23,对应

e?=(?0.25,?0.22,?0.18,?0.15,0.41,0.45,0.48)?

Y?=0.40X?+0.41X?+0.42X?+0.41X??0.36X??0.33X??0.30X?

Y?=?0.25X??0.22X??0.18X??0.15X?+0.41X?+0.45X?+0.48X?

解释:Y?可视为“健康资源与环境综合指数”,数值越大表明公共卫生投入、慢病管理越好且吸烟、摄盐、污染越低;Y?可视为“行为—污染风险指数”,数值越大表明吸烟、摄盐、污染越严重,而资源投入相对不足。

(2)先对Y?、Y?、Z做中心化处理,得

```

Y?Y=[[30.52,?13.44],[?13.44,12.88]]

Y?Z=[158.7,?108.4]?

```

解得标准化回归系数

β?=(Y?Y)?1Y?Z=[4.92,?2.75]?

Z?=4.92Y??2.75Y?

整体显著性:F=(SSR/p)/(SSE/(n?p?1))=(β??Y?Yβ?/2)/((Z?Z?β??Y?Yβ?)/9)=147.3/1.9=77.5F?.??(2,9)=4.26,拒绝原假设,回归显著。

(3)两组样本均值向量与合并协方差阵:

高组(5市):Y??=(1.86,?0.50),低组(7市):Y??=(?0.51,1.29)

S_p=1/(12?2)*[(组内离差)]=[[1.42,?0.63],[?0.63,0.88]]

Fisher判别系数a=S_p?1(Y???Y??)=[2.18,?2.95]?

截距c=?a?(Y??+Y??)=0.83

规则:若2.18Y??2.95Y?0.83判为高组,否则低组。

留一法:循环剔除1市,用剩余11市重算a、c,再预测被剔除市。结果仅第6市被错判(真实低组判为高组),误判率=1/12=8.3%。

——————————————————————

【试题2】

背景:某电商平台对985名高频用户进行问卷与行为追踪,获得5维向量:

X?:月均浏览时长(10h为单位)

X?:月均下单次数

X?:客单价(百元)

X?:售后退货率(%)

X?:优惠券使用占比(%)

研究者怀疑存在潜在“消费成熟度

文档评论(0)

1亿VIP精品文档

相关文档