- 0
- 0
- 约4.66千字
- 约 8页
- 2026-02-08 发布于上海
- 举报
2025年人工智能《机器学习》真题解析
考试时间:______分钟总分:______分姓名:______
一、选择题
1.下列关于机器学习模型的过拟合和欠拟合描述错误的是?
A.过拟合是指模型对训练数据学习得太好,包括噪声数据,导致泛化能力差。
B.欠拟合是指模型过于简单,未能捕捉到数据中的基本模式,导致泛化能力差。
C.增加模型复杂度通常有助于解决欠拟合问题。
D.减少特征数量是解决过拟合的常用方法之一。
2.在监督学习任务中,支持向量机(SVM)的核心思想是?
A.寻找一个决策树,将数据分类。
B.通过最小化均方误差来拟合数据。
C.寻找最优超平面,最大化样本点到超平面的间隔。
D.基于概率密度估计进行分类。
3.下列哪种评价指标适用于不平衡数据集的分类问题?
A.准确率(Accuracy)
B.F1分数(F1-Score)
C.判定系数(R-squared)
D.均方误差(MSE)
4.决策树算法在构建过程中,选择分裂属性时常用的贪心策略是?
A.信息增益(InformationGain)
B.增益比(GainRatio)
C.Gini不纯度(GiniImpurity)
D.误差下降量(ErrorReduction)
5.以下哪种技术属于无监督学习方法?
A.逻辑回归(LogisticRegression)
B.线性回归(LinearRegression)
C.主成分分析(PrincipalComponentAnalysis)
D.K近邻算法(K-NearestNeighbors)
6.在特征工程中,将一个连续特征转换为多个离散区间的方法称为?
A.特征缩放(FeatureScaling)
B.特征编码(FeatureEncoding)
C.标准化(Standardization)
D.分箱(Binning)
7.下列关于交叉验证(Cross-Validation)的说法错误的是?
A.K折交叉验证将数据集分成K个子集,轮流使用K-1个子集训练,1个子集测试。
B.交叉验证可以有效估计模型的泛化能力。
C.交叉验证可以用来选择模型超参数。
D.交叉验证总是比留出法(Hold-outMethod)更准确,但计算成本更高。
8.朴素贝叶斯分类器(NaiveBayesClassifier)的“朴素”假设是指?
A.训练数据足够多。
B.模型必须是线性的。
C.各个特征之间相互独立。
D.模型参数必须是线性的。
9.在使用梯度下降法优化损失函数时,学习率(LearningRate)的选择至关重要,下列说法错误的是?
A.学习率过大可能导致模型不收敛。
B.学习率过小可能导致收敛速度过慢。
C.对于凸函数,任意选择的学习率都能保证找到全局最优解。
D.学习率的选择会影响模型是否能达到最小值。
10.下列哪个不是常见的正则化方法?
A.L2正则化(RidgeRegression)
B.L1正则化(LassoRegression)
C.Dropout
D.数据标准化(DataStandardization)
二、填空题
1.机器学习的目标是通过学习输入数据的______,来预测或决策输出。
2.在逻辑回归中,模型的输出通常是一个介于0和1之间的值,表示样本属于正类的______。
3.决策树的递归构建过程通常以______作为分裂标准,并采用贪心策略进行属性选择。
4.对于回归问题,常用的损失函数包括均方误差(MSE)和______。
5.在处理缺失值时,常见的策略包括删除含有缺失值的样本、使用均值/中位数/众数填充,以及使用______方法。
6.K近邻(KNN)算法是一种典型的______学习算法,其核心思想是d?atrêns?t??ng??nggi?acác?i?md?li?u.
7.降维技术如主成分分析(PCA)可以在保留数据主要变异信息的同时,降低数据的______。
8.评估分类模型性能时,混淆矩阵(ConfusionMatrix)是计算其他评价指标(如准确率、精确率、召回率)的基础。
9.在强化学习中,智能体(Agent)通过与环境(Environment)交互,根据获得的_
原创力文档

文档评论(0)