- 1
- 0
- 约2.53千字
- 约 6页
- 2026-02-13 发布于江苏
- 举报
统计专业知识和实务试题
一、选择题
1.在统计学中,描述性统计的主要目的是()[单选题]*
A.推断总体参数
B.总结和呈现数据特征
C.检验假设的显著性
D.建立预测模型
答案:B
原因:描述性统计的核心是通过均值、方差、图表等方式概括数据分布特征,而非推断或预测。
2.以下哪个指标不适合衡量分类数据的离散程度?()[单选题]*
A.众数
B.异众比率
C.熵
D.标准差
答案:D
原因:标准差适用于连续型数据,分类数据通常使用众数、异众比率或熵衡量离散性。
3.关于正态分布的性质,以下说法错误的是()[单选题]*
A.均值、中位数、众数相等
B.曲线对称且尾部无限延伸
C.峰度系数恒为0
D.标准差决定分布的扁平程度
答案:C
原因:正态分布的峰度系数为3(超额峰度为0),而非0。
4.在假设检验中,P值的定义是()[单选题]*
A.原假设为真的概率
B.观测到比当前结果更极端情况的概率(原假设成立时)
C.备择假设为真的概率
D.检验统计量的临界值
答案:B
原因:P值反映在原假设成立时,数据偏离程度的概率,而非假设本身为真的概率。
5.以下哪种抽样方法可能导致样本偏差?()[多选题]*
A.简单随机抽样
B.方便抽样
C.分层抽样
D.雪球抽样
答案:BD
原因:方便抽样依赖易获取样本,雪球抽样通过推荐扩大样本,均可能引入系统性偏差。
6.线性回归模型中,判定系数(R2)的取值范围是()[单选题]*
A.[0,1]
B.[-1,1]
C.[0,+∞)
D.(-∞,+∞)
答案:A
原因:R2表示模型解释的方差比例,其值越接近1说明拟合效果越好。
7.时间序列数据中,自相关函数(ACF)用于分析()[单选题]*
A.不同时间点的数据相关性
B.变量间的因果关系
C.季节性成分的强度
D.趋势的线性程度
答案:A
原因:ACF通过滞后阶数衡量序列自身的历史值与当前值的相关性。
8.以下不属于非参数检验方法的是()[单选题]*
A.Wilcoxon秩和检验
B.Kruskal-Wallis检验
C.t检验
D.Mann-WhitneyU检验
答案:C
原因:t检验需假设数据服从正态分布,属于参数检验。
9.在贝叶斯统计中,先验分布的作用是()[单选题]*
A.描述样本数据的分布
B.表达对参数的初始信念
C.定义似然函数的形式
D.计算频率学派的置信区间
答案:B
原因:先验分布整合已有知识,与似然函数结合后得到后验分布。
10.主成分分析(PCA)的主要目的是()[多选题]*
A.降低数据维度
B.消除变量间的多重共线性
C.最大化各主成分的方差
D.优化分类模型的准确率
答案:ABC
原因:PCA通过正交变换将相关变量转为不相关主成分,保留最大方差以实现降维。
11.若两组数据的方差齐性检验结果为显著(P0.05),应采用的t检验类型是()[单选题]*
A.独立样本t检验(等方差假设)
B.Welch校正t检验(异方差假设)
C.配对样本t检验
D.单样本t检验
答案:B
原因:方差不齐时,Welch检验通过调整自由度提高结果稳健性。
12.卡方检验通常不适用于以下哪种情况?()[单选题]*
A.检验分类变量的独立性
B.比较两组连续数据的均值
C.评估观察频数与理论频数的差异
D.分析列联表数据
答案:B
原因:卡方检验处理分类数据,连续型数据均值比较需用t检验或ANOVA。
13.关于箱线图(Boxplot)的描述,错误的是()[单选题]*
A.可识别数据中的离群点
B.箱体长度反映四分位距(IQR)
C.须线必须包含最大值和最小值
D.中位数位置显示数据偏态
答案:C
原因:须线通常延伸至1.5倍IQR内的极值,超出部分标记为离群点。
14.在生存分析中,Kaplan-Meier曲线用于()[单选题]*
A.估计中位生存时间
B.比较两组生存率差异
C.建立风险比例模型
D.计算风险函数
答案:A
原因:Kaplan-Meier法通过生存函数估计事件发生时间,中位生存时间为生存概率50%对应的时间点。
15.以下关于中心极限定理(CLT)的条件,正确的是()[多选题]*
原创力文档

文档评论(0)