网站大量收购独家精品文档,联系QQ:2885784924

机器学习 练习题及答案.docx

机器学习 练习题及答案.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

机器学习练习题及答案

一、单选题(共114题,每题1分,共114分)

1.下列误差和错误中,哪一项是由于训练样本的错误而导致?

A、偏差

B、泛化误差

C、噪声

D、方差

正确答案:C

2.决策树中不包含以下哪种结点

A、内部结点

B、外部结点

C、叶节点

D、根节点

正确答案:B

3.以下哪项是非线性降维方法

A、PCA(主成分分析)

B、LDA(线性判别)

C、ICA(独立成分分析)

D、KPCA(核化线性降维)

正确答案:D

4.下列关于线性回归分析中的残差(Residuals)说法正确的是?

A、残差均值总是为零

B、残差均值总是小于零

C、残差均值总是大于零

D、以上说法都不对

正确答案:A

5.下列激活函数中,能够实现将特征限制到区间[-1,1]的是哪一个

A、ReLU

B、Tanh

C、Logistic

D、Sigmoid

正确答案:B

6.极大似然估计中参数是()

A、确定且已知的量

B、已知的随机变量

C、确定且未知的量

D、未知的随机变量

正确答案:C

7.模型评估的常用方法有哪些

A、留出法

B、交叉验证法

C、自助法

D、以上都是

正确答案:D

8.对于在原空间中线性不可分问题,支持向量机()。

A、将数据映射到核空间中

B、在原空间中寻找线性函数划分数据

C、无法处理

D、在原空间中寻找非线性函数的划分数据

正确答案:A

9.()是并行式集成学习方法最著名的代表

A、随机森林

B、Boosting

C、Bagging

D、AdaBoost

正确答案:C

10.朴素贝叶斯分类器的特征不包括

A、孤立的噪声对该分类器的影响不大

B、数据的缺失值影响不大

C、条件独立的假设可能不成立

D、要求数据的属性是相互独立的

正确答案:D

11.朴素贝叶斯分类器的三种实现不包括

A、基于多项式模型实现

B、基于伯努利模型实现

C、基于高斯模型实现

D、属性条件独立性假设实现

正确答案:D

12.下列方法中,属于无监督学习的为()

A、线性回归

B、K均值

C、神经网络

D、决策树

正确答案:B

13.下列哪种方法可以用来缓解过拟合的产生:()。

A、正则化

B、增加更多的特征

C、以上都是

D、增加模型的复杂度

正确答案:A

14.构建一个最简单的线性回归模型需要几个系数(只有一个特征)?

A、3个

B、4个

C、1个

D、2个

正确答案:D

15.当训练集很多时,一种更为强大的结合策略是使用(),即通过另一个学习器来进行结合。

A、学习法

B、平均法

C、投票法

D、加权投票法

正确答案:A

16.以下哪个不是常见的决策树算法

A、ID3

B、C4.5

C、CART

D、DBSCAN

正确答案:D

17.关于SVM泛化误差描述正确的是

A、SVM的误差阈值

B、超平面与支持向量之间距离

C、超平面与支持向量之间距离

正确答案:B

18.下列关于Boosting和Bagging的描述正确的是:

A、Boosting主要关注降低方差

B、Boosting的代表算法有随机森林

C、Bagging基于自助采样法

D、Bagging主要关注降低偏差

正确答案:C

19.关于logistic回归和SVM不正确的是()

A、Logistic回归目标函数是最小化后验概率

B、Logistic回归可以用于预测事件发生概率的大小

C、SVM可以有效避免模型过拟合

D、SVM目标是结构风险最小化

正确答案:A

20.以下哪项不是降维的优点

A、节省空间

B、丢失部分信息

C、将数据可视化,从中获得洞察,了解最重要的特征

D、加速后续的训练算法

正确答案:B

21.KNN算法是基于()

A、概率空间

B、距离空间

C、颜色空间

D、线性空间

正确答案:B

22.?哪些机器学习模型经过训练,能够根据其行为获得的奖励和反馈做出一系列决策?

A、无监督学习

B、监督学习

C、强化学习

D、以上全部

正确答案:C

23.对Boosting模型的描述错误的是

A、采用串行训练模式

B、增加被错误分类样本的权值

C、通过改变训练集进行有针对性的学习

D、基础分类器采用少数服从多数原则进行集成

正确答案:D

24.点击率的预测是一个数据比例不平衡问题(比如训练集中样本呈阴性的比例为99%,阳性的比例是1%),如果我们用这种数据建立模型并使得训练集的准确率高达99%。我们可以得出结论是:

A、模型的准确率非常高,我们不需要进一步探索

B、模型不好,我们应建一个更好的模型

C、无法评价模型

D、以上都不正确

正确答案:B

25.BP算法总结错误的是()。

A、当前层的连接权值梯度,取决于当前层神经元阈值梯度和上一层神经元输出

B、算法只要知道上一层神经元的阈值梯度,就能计算当前层神经元的阈值梯度和连接权值梯度

C、隐层的阈值梯度只跟本层

文档评论(0)

500-500 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档