- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年青少年人工智能挑战赛试题(机器学习基础)全真试题
一、单项选择题(每题2分,共20分)
1.以下哪种任务属于监督学习?
A.对用户点击日志进行聚类分析
B.根据历史销售数据预测下月销售额
C.从新闻文本中提取关键词
D.检测图像中的异常细胞(无标签)
2.关于K近邻(KNN)算法,以下描述错误的是?
A.k值过小时模型容易过拟合
B.通常需要对特征进行标准化处理
C.训练阶段需要存储所有训练数据
D.适用于高维稀疏数据场景
3.若某二分类模型的混淆矩阵中,真正例(TP)=80,假正例(FP)=20,真负例(TN)=90,假负例(FN)=10,则精确率(Precision)为?
A.0.8
B.0.9
C.0.89
D.0.85
4.决策树在分裂节点时,若选择信息增益作为准则,可能会更倾向于选择以下哪种特征?
A.取值种类少的特征
B.取值种类多的特征
C.与目标变量线性相关的特征
D.方差较小的特征
5.以下哪种方法不能缓解神经网络的过拟合问题?
A.增加训练数据量
B.降低模型复杂度
C.使用L2正则化
D.增大学习率
6.线性回归模型中,若使用均方误差(MSE)作为损失函数,其最小二乘解的几何意义是?
A.预测值与真实值的绝对误差之和最小
B.预测值与真实值的欧氏距离平方最小
C.预测值与真实值的曼哈顿距离最小
D.预测值与真实值的余弦相似度最大
7.关于支持向量机(SVM)的核函数,以下说法正确的是?
A.多项式核函数只能处理线性可分问题
B.高斯核函数(RBF核)通过映射将数据隐式转换到高维空间
C.线性核函数的计算复杂度远高于高斯核
D.核函数的选择不影响模型的泛化能力
8.在随机森林算法中,以下哪项不是其“随机”的体现?
A.随机选择样本(有放回抽样)
B.随机选择特征子集
C.随机初始化基决策树的参数
D.随机设定树的最大深度
9.对时间序列数据进行预测时,若使用滑动窗口法构造特征,窗口大小为5,则输入特征的维度是?
A.1
B.5
C.6
D.取决于目标变量的维度
10.以下哪种数据预处理步骤通常不适用于树型模型(如决策树、随机森林)?
A.缺失值填充
B.类别特征独热编码
C.特征标准化(Zscore)
D.异常值检测与处理
二、填空题(每空1分,共15分)
1.机器学习中,将数据划分为训练集、验证集和测试集的主要目的是________。
2.逻辑回归模型的输出表示________的概率,其决策边界是________的。
3.聚类算法中,Kmeans的目标是最小化________,而DBSCAN的核心参数是________和________。
4.梯度下降法中,批量梯度下降(BGD)每次迭代使用________数据,随机梯度下降(SGD)每次使用________数据,小批量梯度下降(MBGD)则使用________数据。
5.评估回归模型性能时,常用的指标有________(写出至少2个);评估分类模型时,除精确率和召回率外,还可使用________(写出1个)。
6.特征工程中,对年龄特征进行分箱处理属于________(填“离散化”或“连续化”);对用户行为序列提取“最近7天登录次数”属于________(填“统计特征”或“结构特征”)。
7.集成学习中,Boosting方法通过________提升弱分类器性能,Bagging方法通过________降低模型方差。
三、简答题(每题6分,共30分)
1.简述监督学习与无监督学习的核心区别,并各举一个实际应用场景。
2.解释“过拟合”现象的表现及产生原因,至少提出3种缓解过拟合的方法。
3.对比线性回归与逻辑回归的异同:从模型形式、损失函数、应用场景三方面说明。
4.随机森林由多棵决策树组成,但为何整体性能通常优于单棵决策树?请从“偏差方差”角度分析。
5.某团队在训练图像分类模型时,发现训练集准确率持续上升但验证集准确率停滞,可能的原因是什么?请提出2种改进措施。
四、编程题(共35分)
(注:本题需基于Python和Scikitlearn库实现,假设已导入必要库,如numpy、pandas、sklearn等)
题目1:房价预测(15分)
给定某城市的房屋数据集(文件:house_data.csv),包含以下特征:
面积(m2):连续数值
房龄(
您可能关注的文档
- 2025年钢筋混凝土结构试题及答案.docx
- 2025年钢筋混凝土试题及答案.docx
- 2025年钢筋检测培训考试试题及答案.docx
- 2025年钢筋力学培训试题及答案.docx
- 2025年钢筋连接试题及答案.docx
- 2025年钢筋试验方法试题及答案.docx
- 2025年钢筋试验计算试题及答案.docx
- 2025年钢筋试验考试题库及答案.docx
- 2025年钢筋水平测试题及答案.docx
- 2025年高级钢筋工理论知识考试练习题库及答案.docx
- 特斯拉专题研究系列三十四:马斯克薪酬计划方案通过,新一代人形机器人发布在即.pdf
- 退名单后的城投有何变化?.pdf
- “十五五”增长新范式.pdf
- 海外政策特朗普2.0背景下的美元表现再思考.pdf
- 海外经济与大类资产:AI对GDP净贡献仍不大,谈投资驱动尚早,剔除AI,美国增长真的为零吗?.pdf
- 食品饮料行业餐饮供应链需求触底改善,重启成长价值.pdf
- 计算机行业深度研究报告:海外AI应用,从大模型到各领域落地.pdf
- 科创&海外市场策略深度报告:科创板2025年三季报分析,盈利持续提升.pdf
- 乔锋智能助力公司开启第二增长极:中高端数控机床领域专精特新“小巨人”企业,新兴产业市场开拓顺利.pdf
- 学习二十届四中全会精神-新质生产力:擘画“十五五”的宏伟蓝图与产业革命.pdf
最近下载
- 【Title】Law of the People’s Republic of China on Choice of Law for Foreign-related Civil Relationships英语.doc VIP
- 2021年9月消化内科护士考试题.docx VIP
- 北京化工大学《有机化学》试卷(样题).pdf VIP
- 会计术语(日语).pdf VIP
- 考录公务员笔试应急预案.docx
- 细胞核的结构和功能.ppt VIP
- 消化内科31病区6月份护理人员三基考试题.docx VIP
- 王维《酌酒与裴迪》古诗词PPT.pptx VIP
- 消化内科新护士独立上岗前考试题.docx VIP
- 2025年“七一”专题党课学习课件(四套)汇编供参考选用.pptx VIP
原创力文档


文档评论(0)