信息技术人工智能：机器学习基础.pdfVIP

下载本文档

0
0
约4.34千字
约 7页
2026-03-06 发布于河南
举报

信息技术人工智能：机器学习基础.pdf

信息技术人工智能：机器学习基础

一、单选题（每题2分，共20分）

1.下列哪项不属于机器学习中的监督学习？（）

A.分类问题B.回归分析C.聚类分析D.预测模型

【答案】C【解析】聚类分析属于无监督学习，通过发现数据内在结构进行分组，不依

赖标注数据。

2.以下哪个算法属于决策树模型？（）

A.支持向量机B.线性回归C.K近邻D.随机森林

【答案】D【解析】随机森林是基于多个决策树集成学习的算法，决策树本身是基础分

类/回归模型。

3.在机器学习中，用于处理缺失值的方法不包括？（）

A.均值填充B.众数填充C.删除含缺失值样本D.模型自学习填充

【答案】D【解析】均值/众数/删除样本是传统处理方法，模型自学习填充属于高级策

略但非标准选项。

4.交叉验证的主要目的是？（）

A.提高模型泛化能力B.减少过拟合C.优化参数选择D.加快训练速度

【答案】A【解析】交叉验证通过多次数据分割测试，评估模型在不同数据集上的稳定

性，从而提升泛化能力。

5.以下哪个指标主要用于评估分类模型？（）

A.均方误差（MSE）B.平均绝对误差（MAE）C.准确率D.均值绝对偏差（MAD）

【答案】C【解析】MSE/MAE/MAD均为回归模型评估指标，准确率用于衡量分类模型正确

预测比例。

6.在神经网络中，激活函数的作用是？（）

A.减少特征维度B.增加模型复杂度C.引入非线性D.优化权重分配

【答案】C【解析】激活函数（如ReLU）使神经网络能拟合复杂非线性关系，否则模型

仅等效线性模型。

7.以下哪个属于过拟合的解决方法？（）

A.增加特征数量B.减少样本量C.正则化D.提高学习率

【答案】C【解析】正则化（如L1/L2）通过惩罚复杂模型防止过拟合，其他选项会加剧

过拟合或降低模型性能。

8.梯度下降算法中，选择学习率的主要考虑因素是？（）

A.数据规模B.模型复杂度C.迭代次数D.以上都是

【答案】D【解析】学习率需平衡收敛速度和稳定性，受数据量、模型参数数量等综合

影响。

9.以下哪个是特征工程的核心步骤？（）

A.模型选择B.数据清洗C.参数调优D.结果可视化

【答案】B【解析】特征工程包括数据清洗、特征提取等预处理步骤，是提升模型效果

的关键。

10.下列关于朴素贝叶斯分类器的描述，错误的是？（）

A.假设特征之间相互独立B.适合高维稀疏数据C.对缺失值敏感D.计算复杂度低

【答案】C【解析】朴素贝叶斯对缺失值处理能力弱，但独立性假设和低复杂度是其特

点。

二、多选题（每题4分，共20分）

1.以下哪些属于监督学习的常见应用？（）

A.图像识别B.时间序列预测C.客户流失分析D.药物研发

E.自动驾驶决策路径规划

【答案】A、B、C【解析】图像识别和预测属于回归/分类，属于监督学习；D通常用强

化学习，E多采用无监督+强化学习。

2.机器学习模型评估中，常用的评估指标包括？（）

A.精确率B.召回率C.F1分数D.ROC曲线E.均方根误差（RMSE）

【答案】A、B、C、D【解析】RMSE为回归模型指标，其余均为分类模型性能衡量方式。

三、填空题（每题4分，共32分）

1.机器学习的基本流程通常包括______、______、______和______四个阶段。

【答案】数据采集；数据预处理；模型训练；模型评估

2.决策树算法中，选择分裂节点的标准主要有______和______两种。

【答案】信息增益；基尼不纯度

3.支持向量机通过寻找最优______来区分不同类别。

【答案】超平面

4.正则化方法中，L1正则化倾向于产生______的模型。

【答案】稀疏

5.交叉验证时，k折交叉验证将数据分为______个子集进行训练和验证。

【答案】k

6.卷积

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

信息技术人工智能：机器学习基础.pdfVIP