- 0
- 0
- 约7.38千字
- 约 10页
- 2026-03-27 发布于上海
- 举报
数据科学专业认证(CDSP)考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下关于数据清洗中缺失值处理的描述,正确的是?
A.缺失值占比超过50%时,必须直接删除该特征
B.对偏态分布的数值型数据,均值填充比中位数填充更合理
C.时间序列数据的缺失值可采用线性插值法处理
D.类别型特征的缺失值只能用众数填充
答案:C
解析:A错误,缺失值占比过高时需综合评估特征重要性,可能选择保留或构造新特征;B错误,偏态分布数据用中位数更能反映集中趋势;C正确,时间序列数据可通过插值法(如线性、多项式插值)利用时序相关性填充;D错误,类别型特征缺失值还可标记为“未知”等新类别。
以下统计量中,用于衡量数据离散程度的是?
A.中位数
B.方差
C.分位数
D.众数
答案:B
解析:A(中位数)、C(分位数)、D(众数)均衡量数据集中趋势;B(方差)通过计算各数据与均值差的平方和的均值,反映数据离散程度。
以下机器学习算法中,属于监督学习的是?
A.K-means聚类
B.主成分分析(PCA)
C.逻辑回归
D.关联规则挖掘(Apriori)
答案:C
解析:监督学习需要标签数据,目标是预测或分类。C(逻辑回归)用于二分类,属于监督学习;A(聚类)、B(降维)、D(关联规则)均为无监督学习。
SQL中,用于合并两个表中满足条件的行的操作是?
A.SELECT
B
您可能关注的文档
- 2026年加拿大注册会计师(CPACanada)考试题库(附答案和详细解析)(0128).docx
- 2026年区块链应用开发工程师考试题库(附答案和详细解析)(0205).docx
- 2026年影视后期制作师考试题库(附答案和详细解析)(0126).docx
- 2026年教师资格证考试考试题库(附答案和详细解析)(0218).docx
- 2026年注册人力资源管理师考试题库(附答案和详细解析)(0206).docx
- 2026年注册人力资源管理师考试题库(附答案和详细解析)(0218).docx
- 2026年注册国际投资分析师(CIIA)考试题库(附答案和详细解析)(0117).docx
- 2026年注册国际投资分析师(CIIA)考试题库(附答案和详细解析)(0224).docx
- 2026年注册工业设计师考试题库(附答案和详细解析)(0222).docx
- 2026年特许公认会计师(ACCA)考试题库(附答案和详细解析)(0205).docx
- 可持续设计-配套ppt教学课件-2.2 可持续-实践为终-大兴机场.pptx
- 可持续设计-配套ppt教学课件-可持续-实践为终(2).pptx
- 可持续设计-配套ppt教学课件-可持续设计-章节关系.pptx
- 可持续设计-配套ppt教学课件-2.1 可持续-实践为终.pptx
- 可持续设计-配套ppt教学课件-2.1 可持续-实践为终(2).pptx
- 可持续设计-配套ppt教学课件-5.4.1服务系统设计案例.pptx
- 可持续设计-配套ppt教学课件-分布式经济-实践为终.pptx
- 2022ZC-C-G02-2X安装使用说明书.docx
- GST-TS-Z01A消防电话主机安装使用说明书.docx
- 2022大空间自动跟踪定位射流 (消防水炮)灭火系统概述.docx
最近下载
- 水利工程建设质量检测管理规范DB51T 3322-2025.docx VIP
- 具身智能的基础知识.pptx
- DB51T 2202-2016 水利工程土石坝施工质量第三方检测规范.docx VIP
- (七下月考)河南省实验中学2025年七年级下学期第一次月考试题英语试卷含答案.doc VIP
- (2025)自身免疫性肝炎诊断和治疗指南.pptx
- 仓管述职报告 (8篇).docx VIP
- 城市水资源循环利用关键技术研究进展.docx VIP
- CNAS-CL02:2023《医学实验室质量和能力认可准则》.pdf
- 免费:初中数学竞赛:运用公式法进行因式分解.doc VIP
- 2026年中考历史材料解析题解题方法指导.docx
原创力文档

文档评论(0)