D2307512023年第三届中国高校大数据挑战赛一等奖.docx

D2307512023年第三届中国高校大数据挑战赛一等奖.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE2

所在组别

2023年第三届中国高校大数据挑战赛

参赛编号

(本科组)

(bdc230751)

基于集成机器学习模型的行业职业技术培训能力评测研究

摘要

本文针对行业职业技术培训能力评测问题展开分析,基于相关性分析、主成分分析、熵权法TOPSIS模型、集成机器学习模型和Stacking融合等方法;借助MATLAB、SPSSPRO、Origin、Lingo和SPSS等软件客观分析了技能考核成绩之间的关联性、并计算了行业职业技术培训能力的评估及预测等问题,为职业培训的具体实施提供客观、科学的参考,进而推动行业职业技术培训能力的持续提升。

针对问题1,首先对各技能考核成绩数据集进行预处理,同时对正负类样本数据存在一定的不平衡进行探索处理,对类别型特征、数值型特征及重要性指标分析见图2-4,并对不平衡数据采用SMOTE过采样处理结果见表3,优化样本数据结构,有利于数据分类识别和评估。其次,对采样数据采用Spearman相关系数和Kendall相关系数进行关联性分析,结果见图6。其结果显示P值均小于0.05,各技能考核成绩与技能考核总成绩之间呈正相关。最后,本文采用Kendall’sW检验对各技能考核成绩进行一致性分析,结果显示Kendall协调系数??值为0.625,数据的相关性程度呈现高度的一致性。

针对问题2,考虑不同培训学校下的生源质量、学校办学条件、学校师资水平等条件的差异性,建立基于熵权法TOPSIS模型对培训学校进行综合评判,并使用熵权法赋予权重,之后计算综合得分,对不同类型的培训学校的培训能力进行了排序,计算得到培训能力前10的学校见表6。

针对问题3,针对不同培训学校的特点,本文采用主成分分析模型提取关键性指标并计算主成分得分。得到学校0-5技能培训优势分别为离校技能2、入学技能1、离校技能1、离校技能1、离校技能1及入学技能2。在KMO检验和Bartlett的检验中,KMO的值为0.659,P值为0.000***,水平上呈现显著性,主成分分析有效。之后依据主成分得分对各技能前5名的学校进行评分,具体结果见表9。

针对问题4,基于主成分得分评估计划颁发职业资格证书的学员,然后对职业资格的评测建立集成机器学习模型(XGBoost、GBDT和RUSBoost),在多分类模型评估指标中引入了Micro-F1、Macro-F1,之后对训练完成的三个基学习器进行Stacking融合。得到影响培训学校在技能培训能力主要特征因素如图8所示,其中入学考核总分成绩特征贡献率超过52%以上,可认为入学考核总分成绩对获取职业资格证书有着非常重要的影响。另外,模型得分情况如表11所示,最后10名学员职业资格的预测结果如表12所示,数据表明stacking融合模型的F1预测值在四个分类器中最高,均达到0.98以上,学习效果更好。最后,本文针对职业资格评测模型进行了灵敏度分析和稳健性检验,用于进一步提高模型的精准度和鲁棒性。

关键词:职业培训;相关性分析;TOPSIS模型;集成机器学习;Stacking融合

PAGE2

1问题重述

研究背景

中国作为制造业大国,对技术工人的需求量大。为此,全国设立了多类职业技术培训学校,提供五种技能培训。学员在入学和离校时均需接受统一考核,成绩决定其职业资格证和就业推荐,也作为主管部门评价培训学校培训效果的依据。但长期以来,这种以离校考核成绩为唯一评价标准的做法存在问题。学员成绩不仅受培训学校培训能力影响,还受学员自身素质等因素制约。因此,部分学校更重视生源质量而非改进培训方法,导致培训效果不均,挫伤了学校和教员的积极性,降低了总体培训质量。因此,对培训学校进行公正合理的培训能力评价至关重要。

本研究旨在深入剖析影响行业职业技术培训能力的诸多因素,为相关决策提供坚实的数据支撑和理论依据。通过系统分析,我们期望能为职业培训项目的具体实施提供客观、科学的参考,进而推动行业职业技术培训能力的持续提升。

文献综述

马克思在《资本论》中提出,为了使人获得全方位的发展,首先要对自身特点进行剖析,然后通过多样化的职业技能培训帮助劳动者提升自身的职业素质和工作能力[1]。在本文中研究对象是培训学员,职业培训要注重开发其的内在潜力,使他们获得工作技能和文化知识,达到全方位的发展,提升综合素质,从而推动社会稳定进步。

崔晓杰(2012)对高职学院职业培训存在问题以及制约因素进行分析,提出从学院定位、校内资源整合、师资力量、管理体系、培训模式、培训资源开发等方面加强培训能力的建设[2]。刁丽丽(2013)从公共关系的角度对职业培训机构的社会责任及市场、行业、社会、法律、政府规制建设等内容进行了研究[3]。郭月兰(2014)提出先前学习认证的方法以增加职业培训的途径、提高培训的效果[4]。Alvarez

文档评论(0)

数学建模-赛道做 + 关注
实名认证
服务提供商

各类数学建模竞赛-文档,及优秀论文分享

1亿VIP精品文档

相关文档