- 1
- 0
- 约6.93千字
- 约 10页
- 2026-04-17 发布于江苏
- 举报
数据科学专业认证(CDSP)考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪项不属于数据清洗的核心任务?
A.处理缺失值
B.去除重复记录
C.计算特征重要性
D.修正异常值
答案:C
解析:数据清洗的核心任务包括处理缺失值(A)、去除重复记录(B)、修正异常值(D)等,旨在提高数据质量。计算特征重要性(C)属于特征工程或模型训练阶段的任务,因此选C。
在监督学习中,“过拟合”现象的主要原因是?
A.模型复杂度不足
B.训练数据量过大
C.模型对训练数据噪声过度学习
D.测试数据分布与训练数据不一致
答案:C
解析:过拟合是模型在训练数据上表现很好,但在新数据上泛化能力差,主要原因是模型过度学习了训练数据中的噪声和细节(C)。模型复杂度不足会导致欠拟合(A错误),训练数据量过大通常缓解过拟合(B错误),测试数据分布不一致属于数据偏移问题(D错误)。
以下哪种统计量用于衡量数据分布的对称性?
A.方差
B.偏度
C.峰度
D.均值
答案:B
解析:偏度(Skewness)衡量数据分布的不对称程度(B正确);方差衡量数据离散程度(A错误),峰度衡量分布的尖峰或平尾程度(C错误),均值是集中趋势指标(D错误)。
若混淆矩阵中TP=80,FP=20,FN=10,TN=90,则精确率(Precision)为?
A.80/(80+10)=0.89
B.
您可能关注的文档
- 2026年咖啡师考试题库(附答案和详细解析)(0202).docx
- 2026年审计专业技术资格考试题库(附答案和详细解析)(0312).docx
- 2026年智能制造工程师考试题库(附答案和详细解析)(0202).docx
- 2026年注册产品设计师考试题库(附答案和详细解析)(0225).docx
- 2026年注册化工工程师考试题库(附答案和详细解析)(0225).docx
- 2026年注册土木工程师考试题库(附答案和详细解析)(0304).docx
- 2026年渗透测试工程师考试题库(附答案和详细解析)(0216).docx
- 2026年矫正社会工作师考试题库(附答案和详细解析)(0216).docx
- 2026年跨境电商运营师考试题库(附答案和详细解析)(0122).docx
- CCNP网络技术题库及答案.doc
原创力文档

文档评论(0)