机器学习练习题及答案.docx

下载文档

0
0
约1.01万字
约 27页
2025-03-24 发布于河南
举报
版权申诉
保障服务

机器学习练习题及答案.docx

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、本文档共27页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

机器学习练习题及答案

一、单选题（共114题，每题1分，共114分）

1.下列误差和错误中，哪一项是由于训练样本的错误而导致？

A、偏差

B、泛化误差

C、噪声

D、方差

正确答案：C

2.决策树中不包含以下哪种结点

A、内部结点

B、外部结点

C、叶节点

D、根节点

正确答案：B

3.以下哪项是非线性降维方法

A、PCA(主成分分析)

B、LDA（线性判别）

C、ICA（独立成分分析）

D、KPCA(核化线性降维)

正确答案：D

4.下列关于线性回归分析中的残差（Residuals）说法正确的是？

A、残差均值总是为零

B、残差均值总是小于零

C、残差均值总是大于零

D、以上说法都不对

正确答案：A

5.下列激活函数中，能够实现将特征限制到区间[-1,1]的是哪一个

A、ReLU

B、Tanh

C、Logistic

D、Sigmoid

正确答案：B

6.极大似然估计中参数是（）

A、确定且已知的量

B、已知的随机变量

C、确定且未知的量

D、未知的随机变量

正确答案：C

7.模型评估的常用方法有哪些

A、留出法

B、交叉验证法

C、自助法

D、以上都是

正确答案：D

8.对于在原空间中线性不可分问题，支持向量机（）。

A、将数据映射到核空间中

B、在原空间中寻找线性函数划分数据

C、无法处理

D、在原空间中寻找非线性函数的划分数据

正确答案：A

9.（）是并行式集成学习方法最著名的代表

A、随机森林

B、Boosting

C、Bagging

D、AdaBoost

正确答案：C

10.朴素贝叶斯分类器的特征不包括

A、孤立的噪声对该分类器的影响不大

B、数据的缺失值影响不大

C、条件独立的假设可能不成立

D、要求数据的属性是相互独立的

正确答案：D

11.朴素贝叶斯分类器的三种实现不包括

A、基于多项式模型实现

B、基于伯努利模型实现

C、基于高斯模型实现

D、属性条件独立性假设实现

正确答案：D

12.下列方法中，属于无监督学习的为（）

A、线性回归

B、K均值

C、神经网络

D、决策树

正确答案：B

13.下列哪种方法可以用来缓解过拟合的产生：()。

A、正则化

B、增加更多的特征

C、以上都是

D、增加模型的复杂度

正确答案：A

14.构建一个最简单的线性回归模型需要几个系数（只有一个特征）？

A、3个

B、4个

C、1个

D、2个

正确答案：D

15.当训练集很多时，一种更为强大的结合策略是使用（），即通过另一个学习器来进行结合。

A、学习法

B、平均法

C、投票法

D、加权投票法

正确答案：A

16.以下哪个不是常见的决策树算法

A、ID3

B、C4.5

C、CART

D、DBSCAN

正确答案：D

17.关于SVM泛化误差描述正确的是

A、SVM的误差阈值

B、超平面与支持向量之间距离

C、超平面与支持向量之间距离

正确答案：B

18.下列关于Boosting和Bagging的描述正确的是：

A、Boosting主要关注降低方差

B、Boosting的代表算法有随机森林

C、Bagging基于自助采样法

D、Bagging主要关注降低偏差

正确答案：C

19.关于logistic回归和SVM不正确的是（）

A、Logistic回归目标函数是最小化后验概率

B、Logistic回归可以用于预测事件发生概率的大小

C、SVM可以有效避免模型过拟合

D、SVM目标是结构风险最小化

正确答案：A

20.以下哪项不是降维的优点

A、节省空间

B、丢失部分信息

C、将数据可视化，从中获得洞察，了解最重要的特征

D、加速后续的训练算法

正确答案：B

21.KNN算法是基于（）

A、概率空间

B、距离空间

C、颜色空间

D、线性空间

正确答案：B

22.?哪些机器学习模型经过训练，能够根据其行为获得的奖励和反馈做出一系列决策？

A、无监督学习

B、监督学习

C、强化学习

D、以上全部

正确答案：C

23.对Boosting模型的描述错误的是

A、采用串行训练模式

B、增加被错误分类样本的权值

C、通过改变训练集进行有针对性的学习

D、基础分类器采用少数服从多数原则进行集成

正确答案：D

24.点击率的预测是一个数据比例不平衡问题（比如训练集中样本呈阴性的比例为99%，阳性的比例是1%），如果我们用这种数据建立模型并使得训练集的准确率高达99%。我们可以得出结论是：

A、模型的准确率非常高，我们不需要进一步探索

B、模型不好，我们应建一个更好的模型

C、无法评价模型

D、以上都不正确

正确答案：B

25.BP算法总结错误的是（）。

A、当前层的连接权值梯度，取决于当前层神经元阈值梯度和上一层神经元输出

B、算法只要知道上一层神经元的阈值梯度，就能计算当前层神经元的阈值梯度和连接权值梯度

C、隐层的阈值梯度只跟本层

您可能关注的文档

文档评论（0）

500-500 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

机器学习练习题及答案.docx