机器学习基础笔试题及答案.docxVIP

下载本文档

0
0
约3.2千字
约 5页
2025-12-06 发布于河北
举报
版权申诉

机器学习基础笔试题及答案.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

机器学习基础笔试题及答案

一、单项选择题（共10题，每题3分，共30分）

以下哪种算法不属于监督学习？（）

A.线性回归B.K均值聚类C.逻辑回归D.决策树分类

在逻辑回归中，Sigmoid函数的输出范围是？（）

A.(-∞,+∞)B.[0,1]C.(-1,1)D.[0,+∞)

下列关于过拟合的说法，错误的是？（）

A.过拟合是模型在训练集上表现好，测试集上表现差

B.增加训练数据量可能缓解过拟合

C.过拟合说明模型的偏差过大

D.正则化是解决过拟合的常用方法

决策树算法中，用于选择最优特征的指标不包括？（）

A.信息增益B.基尼系数C.方差D.信息增益比

支持向量机（SVM）的核心思想是？（）

A.最小化训练误差B.最大化分类间隔C.最小化模型复杂度D.最大化信息增益

下列哪种优化算法是基于梯度下降的批量更新方法？（）

A.SGD（随机梯度下降）B.BGD（批量梯度下降）C.AdamD.RMSprop

在聚类算法中，K均值聚类的“K”代表？（）

A.迭代次数B.特征维度C.聚类簇的数量D.样本数量

以下哪种模型可用于处理缺失值？（）

A.朴素贝叶斯B.随机森林C.感知机D.主成分分析（PCA）

交叉验证的主要目的是？（）

A.减少计算量B.评估模型的泛化能力C.提高模型准确率D.简化模型结构

朴素贝叶斯算法的“朴素”体现在？（）

A.假设特征之间相互独立B.模型结构简单C.只适用于二分类问题D.计算复杂度低

二、多项选择题（共5题，每题4分，共20分，多选、少选、错选均不得分）

以下属于降维算法的有？（）

A.PCA（主成分分析）B.LDA（线性判别分析）C.KNN（K近邻）D.t-SNE

下列哪些是衡量分类模型性能的指标？（）

A.准确率（Accuracy）B.召回率（Recall）C.均方误差（MSE）D.F1分数

关于随机森林，以下说法正确的有？（）

A.是集成学习的一种方法B.基于多棵决策树的投票结果C.能有效避免过拟合D.训练过程中每棵树使用相同的训练数据

线性回归中，评估模型拟合效果的指标包括？（）

A.R2（决定系数）B.残差平方和C.基尼系数D.平均绝对误差（MAE）

以下哪些算法可用于回归任务？（）

A.线性回归B.梯度提升树（GBR）C.支持向量回归（SVR）D.逻辑回归

三、简答题（共3题，每题10分，共30分）

简述监督学习、无监督学习和半监督学习的区别，并各举一个实际应用场景。

什么是正则化？L1正则化和L2正则化的区别是什么？

简述KNN算法的工作原理、优点和缺点。

四、计算题（共1题，每题20分，共20分）

已知某线性回归模型的训练数据如下表，特征x为单一变量，目标值为y：

假设模型为y=wx+b（w为权重，b为偏置），使用最小二乘法求解w和b的值。

答案部分

一、单项选择题

B解析：K均值聚类无标签数据，属于无监督学习；其余均为监督学习算法。

B解析：Sigmoid函数σ(z)=1/(1+e??)，输出始终在[0,1]之间，适用于二分类概率预测。

C解析：过拟合是模型复杂度过高，导致方差过大；偏差过大对应欠拟合。

C解析：方差是衡量数据离散程度的指标，常用于回归问题；信息增益、基尼系数、信息增益比是决策树特征选择的核心指标。

B解析：SVM的核心是找到最优分离超平面，最大化分类间隔，提高泛化能力。

B解析：BGD每次迭代使用全部训练数据计算梯度；SGD用单个样本，Adam和RMSprop是改进型随机梯度下降。

C解析：K均值聚类需预先指定聚类簇数量K，通过迭代优化簇中心。

B解析：随机森林可通过样本和特征的随机性，自动处理缺失值；朴素贝叶斯、感知机对缺失值敏感，PCA不直接处理缺失值。

B解析：交叉验证通过划分训练集和验证集的多次迭代，更全面评估模型泛化能力，避免单次划分的偶然性。

A解析：朴素贝叶斯假设所有特征相互独立，简化计算，这是“朴素”的核心含义。

二、多项选择题

ABD解析：PCA、LDA、t-SNE均为降维算法；KNN是分类/回归算法，无降维功能。

ABD解析：准确率、召回率、F1分数是分类模型指标

您可能关注的文档

文档评论（0）

151****9429 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

机器学习基础笔试题及答案.docxVIP