- 0
- 0
- 约8.57千字
- 约 12页
- 2026-03-02 发布于上海
- 举报
数据建模工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
在数据预处理阶段,针对高维稀疏的类别型特征(如用户职业),最适合的处理方法是?
A.直接删除该特征
B.均值填补缺失值
C.独热编码(One-HotEncoding)
D.标准化(Z-Score)
答案:C
解析:类别型特征需通过编码转换为数值型,独热编码能有效保留类别间的独立性,避免顺序假设(如职业无高低之分)。A错误,直接删除会丢失关键信息;B错误,均值填补适用于数值型缺失值;D错误,标准化适用于连续型特征的量纲统一。
以下哪项是衡量分类模型在正负样本分布不均衡时的最优指标?
A.准确率(Accuracy)
B.F1分数(F1-Score)
C.均方误差(MSE)
D.R2决定系数
答案:B
解析:F1分数是精确率(Precision)和召回率(Recall)的调和平均,能平衡正负样本的分类效果,尤其在数据不均衡时更可靠。A错误,准确率在负样本占比99%时可能因“全判负”虚高;C、D错误,均为回归模型指标。
训练随机森林时,若模型在训练集上准确率95%,测试集上仅60%,最可能的原因是?
A.学习率过高
B.树的数量(n_estimators)太少
C.树的深度(max_depth)过大
D.特征数量不足
答案:C
解析:训练集表现远好于测试集是典型过拟合现象,随机森林过拟合通常因
您可能关注的文档
- 户外用品供销合作协议.docx
- 5”来源解析与控制.docx
- 2025年志愿服务管理师考试题库(附答案和详细解析)(1228).docx
- 2026年基因数据解读师考试题库(附答案和详细解析)(0112).docx
- 2026年基因数据解读师考试题库(附答案和详细解析)(0113).docx
- 2026年价格鉴证师考试题库(附答案和详细解析)(0123).docx
- 2026年渗透测试工程师考试题库(附答案和详细解析)(0103).docx
- 2026年渗透测试工程师考试题库(附答案和详细解析)(0130).docx
- 2026年注册气象工程师考试题库(附答案和详细解析)(0122).docx
- 2026年注册气象工程师考试题库(附答案和详细解析)(0129).docx
- 肿瘤血液科主任医师2025年年底工作总结及2026年工作计划.docx
- 2025政治高考天津市考试真题及答案.docx
- 14 2026年高考小说阅读分析小说主题意蕴专项训练(学生版).pdf
- 12 信息类文本融合整本书阅读创新考法(教师版).pdf
- 16 探究小说的主旨意蕴.pdf
- 15 信息类文本阅读之科普文、访谈、调查类文本阅读专项训练(学生版).pdf
- 2025年12月21日更新-【OECD】2025年收入统计:解析经合组织国家的个人所得税收入.pdf
- 2025年12月19日更新-【西部证券】固定收益专题报告:REITs配置窗口渐进,聚焦三季报韧性主线.pdf
- 2025年12月19日更新-【IMF】水资源宏观临界性-2025.12.pdf
- 【2026】年北京延庆区高三一模高考英语试卷试题(解析版).pdf
最近下载
- (2026春新版)人教版三年级数学下册全册教案.doc
- 2025-2026学年小学信息科技泰山版2024六年级下册-泰山版2024教学设计合集.docx
- 2026年幼儿健康教育(学前教育)试题及答案.doc VIP
- 康吉森TSxPlus系统说明书用户手册.pdf
- 2025年河南测绘职业学院单招职业倾向性测试题库(历年真题).docx
- 2025年上海市闵行区中考英语二模试卷.docx VIP
- 部编版语文五年级下册第五单元教材解读大单元集体备课.pptx VIP
- 住院医师规范化培训结业临床技能考核第一站病史采集评分标准.pdf VIP
- 2025年上海市闵行区中考二模九年级下学期数学试卷.pdf VIP
- 2026天津中考:政治重点知识点.doc VIP
原创力文档

文档评论(0)