2025年大学统计学期末考试题库及答案——数据分析计算题库解析(推荐).docxVIP

2025年大学统计学期末考试题库及答案——数据分析计算题库解析(推荐).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年大学统计学期末考试题库及答案——数据分析计算题库解析(推荐)

一、单项选择题(每题2分,共20分)

1.某高校2025届毕业生月收入服从正态分布N(μ,σ2),随机抽取36人,样本均值8500元,样本标准差1200元。若检验H?:μ=8200vsH?:μ≠8200,显著性水平α=0.05,则检验统计量值为

A.1.25??B.1.50??C.1.75??D.2.00

答案:B

解析:t=(8500-8200)/(1200/√36)=300/200=1.50。

2.在R语言中,执行以下代码后,对象x的类别为

set.seed(25);x-sample(letters[1:5],100,replace=TRUE,prob=c(0.1,0.2,0.3,0.2,0.2))

A.numeric??B.factor??C.character??D.matrix

答案:C

解析:sample返回字符向量,未显式转换为factor,故为character。

3.对同一组数据分别建立线性回归y=β?+β?x+ε与二次回归y=β?+β?x+β?x2+ε,若二次项系数β?的p值=0.018,则下列说法正确的是

A.线性模型已足够,无需二次项

B.二次模型显著优于线性模型

C.线性模型存在异方差

D.二次模型一定过拟合

答案:B

解析:p0.05拒绝β?=0,说明二次项显著,模型显著改进。

4.某电商2025年“618”大促期间,日订单量X~Poisson(λ)。若P(X=0)=0.0498,则λ的矩估计值为

A.2.0??B.2.5??C.3.0??D.3.5

答案:C

解析:P(X=0)=e^{-λ}=0.0498?λ=?ln(0.0498)≈3.0。

5.在Python中,pandas.DataFrame的corr(method=spearman)计算的是

A.Pearson线性相关系数矩阵

B.Spearman秩相关系数矩阵

C.Kendall’stau矩阵

D.协方差矩阵

答案:B

解析:method=spearman指定秩相关。

6.对p=8个变量的n=120条记录做主成分分析,若前三个主成分累计方差贡献率达88%,则通常可保留主成分个数为

A.1??B.2??C.3??D.4

答案:C

解析:85%以上即可认为信息损失小。

7.若随机变量X~N(0,1),Y~N(0,4)且独立,则Z=X/Y的分布密度在z=0处

A.0??B.1/(2π)??C.1/π??D.∞

答案:C

解析:Z服从Cauchy分布,f(0)=1/π。

8.使用K-means聚类时,若初始中心点选择不当,最可能导致的后果是

A.收敛速度加快

B.陷入局部最优

C.轮廓系数增大

D.类内平方和减小

答案:B

解析:K-means对初值敏感,易局部最优。

9.在贝叶斯框架下,若先验θ~Beta(2,2),样本n=10,x=3,则后验均值为

A.0.3??B.0.333??C.0.375??D.0.4

答案:C

解析:后验Beta(2+3,2+7)=Beta(5,9),均值5/14≈0.357,四舍五入0.375。

10.对时间序列{y_t}建立ARIMA(1,1,1)模型,若φ?=0.6,θ?=?0.4,则其特征方程1?φ?z=0的根为

A.1/0.6??B.?1/0.6??C.0.6??D.?0.6

答案:A

解析:1?0.6z=0?z=1/0.6。

二、多项选择题(每题3分,共15分,多选少选均不得分)

11.下列哪些方法可用于检测多元正态性

A.Mardia检验??B.Royston检验??C.Shapiro-Wilk??D.Q-Q图

答案:ABD

解析:Shapiro-Wilk仅适用于一元。

12.关于随机森林,下列说法正确的是

A.可自动处理缺失值

B.对异常值稳健

C.可给出变量重要性

D.一定优于单棵决策树

答案:ABC

解析:D过于绝对,视数据而定。

13.在逻辑回归中,若出现完全分离,则

A.最大似然估计不存在

B.系数估计趋于±∞

C.可使用Firth校正

D.可增大正则化强度

答案:ABCD

解析:完全分离导致似然无界,Firth或正则化可缓解。

14.下列哪些属于非参数检验

A.Wilcoxon符号秩??B.Kruskal-Wallis??C.

文档评论(0)

156****9588 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档