D2307512023年第三届中国高校大数据挑战赛一等奖.pdf

D2307512023年第三届中国高校大数据挑战赛一等奖.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

所在组别参赛编号

2023年第三届中国高校大数据挑战赛

(本科组)(

bdc230751)

基于集成机器学习模型的行业职业技术培训能力评测研究

摘要

本文针对行业职业技术培训能力评测问题展开分析,基于相关性分析、主成分分析、

熵权法TOPSIS模型、集成机器学习模型和Stacking融合等方法;借助MATLAB、

SPSSPRO、Origin、Lingo和SPSS等软件客观分析了技能考核成绩之间的关联性、并计

算了行业职业技术培训能力的评估及预测等问题,为职业培训的具体实施提供客观、科

学的参考,进而推动行业职业技术培训能力的持续提升。

针对问题1,首先对各技能考核成绩数据集进行预处理,同时对正负类样本数据存

在一定的不平衡进行探索处理,对类别型特征、数值型特征及重要性指标分析见图2-4,

并对不平衡数据采用SMOTE过采样处理结果见表3,优化样本数据结构,有利于数据

分类识别和评估。其次,对采样数据采用Spearman相关系数和Kendall相关系数进行关

联性分析,结果见图6。其结果显示P值均小于0.05,各技能考核成绩与技能考核总成

绩之间呈正相关。最后,本文采用Kendall’sW检验对各技能考核成绩进行一致性分析,

结果显示Kendall协调系数值为0.625,数据的相关性程度呈现高度的一致性。

针对问题2,考虑不同培训学校下的生源质量、学校办学条件、学校师资水平等条

件的差异性,建立基于熵权法TOPSIS模型对培训学校进行综合评判,并使用熵权法赋

予权重,之后计算综合得分,对不同类型的培训学校的培训能力进行了排序,计算得到

培训能力前10的学校见表6。

针对问题3,针对不同培训学校的特点,本文采用主成分分析模型提取关键性指标

并计算主成分得分。得到学校0-5技能培训优势分别为离校技能2、入学技能1、离校技

能1、离校技能1、离校技能1及入学技能2。在KMO检验和Bartlett的检验中,KMO

的值为0.659,P值为0.000***,水平上呈现显著性,主成分分析有效。之后依据主成分

得分对各技能前5名的学校进行评分,具体结果见表9。

针对问题4,基于主成分得分评估计划颁发职业资格证书的学员,然后对职业资格

的评测建立集成机器学习模型(XGBoost、GBDT和RUSBoost),在多分类模型评估指

标中引入了Micro-F1、Macro-F1,之后对训练完成的三个基学习器进行Stacking融合。

得到影响培训学校在技能培训能力主要特征因素如图8所示,其中入学考核总分成绩特

征贡献率超过52%以上,可认为入学考核总分成绩对获取职业资格证书有着非常重要的

影响。另外,模型得分情况如表11所示,最后10名学员职业资格的预测结果如表12所

示,数据表明stacking融合模型的F1预测值在四个分类器中最高,均达到0.98以上,学

习效果更好。最后,本文针对职业资格评测模型进行了灵敏度分析和稳健性检验,用于

进一步提高模型的精准度和鲁棒性。

关键词:职业培训;相关性分析;TOPSIS模型;集成机器学习;Stacking融合

1

1问题重述

1.1研究背景

中国作为制造业大国,对技术工人的需求量大。为此,全国设立了多类职业技术培训

学校,提供五种技能培训。学员在入学和离校时均需接受统一考核,成绩决定其职业资格

证和就业推荐,也作为主管部门评价培训学校培训效果的依据。但长期以来,这种以离校

考核成绩为唯一评价标准的做法存在问题。学员成绩不仅受培训学校培训能力影响,还受

学员自身素质等因素制约。因此,部分学校更重视生源质量而非改进培训方法,导致培训

效果不均,挫伤了学校和教员的积极性,降低了总体培训质量。因此,对培训学校进行公

正合理的培训能力评价至关重要。

本研究旨在

文档评论(0)

数学建模-赛道做 + 关注
实名认证
服务提供商

各类数学建模竞赛-文档,及优秀论文分享

1亿VIP精品文档

相关文档