- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第PAGE1页,共NUMPAGES1页
一、单项选择题(本大题共10小题,每题3分,共30分)试卷(2021
试卷
(2021-2022学年第1学期)
考试科目机器学习-Python实践(A卷)
适用专业班级(年级)得分
命题人:审阅人:
班级学号姓名考试科目
装订线
1、假设你正在做一个项目,它是一个二元分类问题。你在数据集上训练一个模型,并在验证数据集上得到混淆矩阵。基于上述混淆矩阵,下面哪个选项会给你正确的预测。()
1精确度是~0.91
2错误分类率是~0.91
3假正率(Falsecorrectclassification)是~0.95
4真正率(Truepositiverate)是~0.95
A1和3
B2和4
C1和4
D2和3
2、对于下面的超参数来说,更高的值对于决策树算法更好吗?
1用于拆分的样本量()
2树深
3树叶样本
A1和2
B2和3
C1和3
D1、2和3
E无法分辨
3、假如我们使用非线性可分的SVM目标函数作为最优化对象,我们怎么保证模型线性可分?()
A设C=1
B设C=0
C设C=无穷大
D以上都不对
4、NaveBayes是一种特殊的Bayes分类器,特征变量是X,类别标签是C,它的一个假定是:()
A.各类别的先验概率P(C)是相等的
B.以0为均值,sqr(2)/2为标准差的正态分布
C.特征变量X的各个维度是类别条件独立随机变量
D.P(X|C)是高斯分布
5、假定某同学使用NaiveBayesian(NB)分类模型时,不小心将训练数据的两个维度搞重复了,那么关于NB的说法中正确的是:()
A.这个被重复的特征在模型中的决定作用会被加强
B.模型效果相比无重复特征的情况下精确度会降低
C.如果所有特征都被重复一遍,得到的模型预测结果相对于不重复的情况下的模型预测结果一样。
D.当两列特征高度相关时,无法用两列特征相同时所得到的结论来分析问题
6、统计模式分类问题中,当先验概率未知时,可以使用()
A.最小最大损失准则
B.最小误判概率准则
C.最小损失准则
D.N-P判决
7、甲盒中有200个螺杆,其中有160个A型螺杆;乙盒中有240个螺母,其中有180个A型的。现从甲乙两盒中各任取一个,则能配成A型螺栓的概率为多少?()
A.1/20
B.15/16
C.3/5
D.19/20
8、关于激活函数功能表述正确的是?()
A.信号强度大于阈值的向下一层传播
B.信号强度小于阈值的向下一层传播
C.信号强度始终不向下一层传播
D.以上都不对
9、激活函数的作用描述错误的是?()
A.辅助信号传输的门控函数
B.构建模型的非线性特性
C.提升学习复杂模型的能力
D.对与非线性没有帮助,可有可无
10、如下那些函数没有梯度消失的问题?()
A.ReLU
B.sigmoid
C.tanh
D.softmax
二、判断题(本大题共10小题,每题1分,共10分)
1、如果一个经过训练的机器学习模型在测试集上达到100%的准确率, 这是否意味着该模型将在另外一个新的测试集上也能得到100%的准确率。 ()
2、如果自变量X和因变量Y之间存在高度的非线性和复杂关系,那 么树模型很可能优于经典回归方法。()
3、在训练完SVM之后,我们可以只保留支持向量,而舍去所有非支持 向量。 仍然不会影响模型分类能力。()
4、两个变量相关,它们的相关系数r可能为0。()
5、如果两个变量相关,那么它们一定是线性关系吗?()
6、“过拟合”只在监督学习中出现,在非监督学习中,没有“过拟合”, 这是()
7、错误率(ErrorRate)是分类错误的样本数占样本总数的比例。 ()
8、DSS主要是基于数据仓库.联机数据分析和数据挖掘技术的应用。 ()
9、OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息, 是继数据库技术发展之后迅猛发展起来的一种新技术。()
10、
文档评论(0)