青海2025自考[生物医药数据科学]机器学习与药物发现易错题专练.docxVIP

下载本文档

0
0
约9.55千字
约 28页
2026-03-20 发布于四川
举报

青海2025自考[生物医药数据科学]机器学习与药物发现易错题专练.docx

青海2025自考[生物医药数据科学]机器学习与药物发现易错题专练

1.题目：在药物发现中，以下哪种特征选择方法属于过滤法？

A.递归特征消除法

B.随机森林特征重要性排序

C.卡方检验

D.基于模型的特征选择

答案：C

分析：过滤法是基于特征的统计特性来选择特征，卡方检验是常用的过滤法特征选择方法。递归特征消除法、随机森林特征重要性排序和基于模型的特征选择都属于包装法或嵌入法，它们依赖于模型的性能来选择特征。

2.题目：在机器学习中，过拟合现象通常出现在以下哪种情况？

A.训练数据过少，模型复杂度高

B.训练数据过多，模型复杂度低

C.训练数据和测试数据分布不一致

D.训练数据噪声大

答案：A

分析：过拟合是指模型在训练数据上表现很好，但在测试数据上表现不佳。当训练数据过少且模型复杂度高时，模型会过度学习训练数据中的噪声和细节，导致泛化能力差，出现过拟合现象。训练数据过多、模型复杂度低一般不易过拟合；训练数据和测试数据分布不一致是数据分布问题；训练数据噪声大可能影响模型性能，但不是过拟合的典型原因。

3.题目：在药物发现的机器学习模型评估中，以下哪个指标主要用于衡量模型对正样本的预测能力？

A.准确率

B.召回率

C.特异性

D.F1值

答案：B

分析：召回率是指模型正确预测的正样本占实际正样本的比例，主要用于衡量模型对正样本的预测能力。准确率是

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

青海2025自考[生物医药数据科学]机器学习与药物发现易错题专练.docxVIP