2024“泰迪杯”数据挖掘挑战赛特等奖.pdf

2024“泰迪杯”数据挖掘挑战赛特等奖.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

生产线的故障自动识别与人员配置的选题研究

摘要

本文针对生产线的故障自动识别与人员配置问题展开分析。基于集成机器学习模型、

因子分析、Stacking融合和多目标线性规划模型等方法;借助MATLAB、SPSS等软件客

观分析了生产线中各装置故障的数据特征,同时探究了产品质量、合格率、生产线与操

作人员等因素之间的关联性;然后计算了每条生产线中各装置每月的故障总次数,故障

发生持续时长的最值以及人员配置等问题。并据此为生产线制定最佳的操作人员排班方

案,从而为企业的可持续发展提供有力支持。

针对问题1,基于生产线各装置故障信号识别的问题。首先对生产线各装置运行记

录数据集进行预处理,然后对装置故障信号的识别建立集成机器学习模型(XGBoost、

GBDT和RUSBoost),在多分类模型评估指标中引入了Micro-F1、Macro-F1,之后对训

练完成的三个基学习器进行Stacking融合,得到模型对生产线装置故障信号的识别程度

见表6,其中训练集F1分数均大于0.96,效果呈现显著性;Micro-F1与Macro-F1均超

过了0.90,表明此模型对测试集数据识别程度较好。另外,stacking融合模型得分情况

如表7所示,数据表明stacking融合模型的F1预测值在四个分类器中最高,均达到0.98

以上,而且对装置故障识别预测方面具有较高的泛化能力,学习效果更好。

针对问题2,基于生产线装置故障信号报警的应用问题。首先应用问题1所建模型,

通过分析附件2中数据给出故障报警的日期、开始时间与持续时长,筛选出影响生产线

故障在故障报警模型主要特征因素见图6。结果表明加盖定位数的特征贡献率显著突出,

超过了9.00%,揭示了加盖定位数在生产线故障自动识别过程中的核心作用。最后借助

MATLAB计算每条生产线中各装置每月的故障总次数,以及故障发生持续时长的最值,

并在表8~9列举了生产线M101和M102的计算结果。

针对问题3,基于生产线各因素关系探究问题。首先整合附件3数据,采用因子分

析法对影响产品合格率的主要因素进行数据降维,因子权重见表12。其次,对采样数据

采用Spearman相关系数和Kendall相关系数进行相关性分析,结果见图6,其结果显示

P值均小于0.05,得出加盖定位数、推盖数与产品合格率之间具有显著的正相关性。最

后,本文采用Kendall’sW检验对生产线各因素之间进行一致性分析,结果显示Kendall

协调系数值为0.625,数据的相关性程度呈现高度的一致性。

针对问题4,基于生产线人员配置问题。首先参考问题3生产线与操作人员等因素

分析结果,并考虑生产线与操作人员的搭配建立多目标线性规划排班模型,通过引入罚

函数,扩大最优解搜索范围。然后以安排的操作员工数量最少、每天的实际人效尽量均

衡和添加设定的软约束条件个数之和最少作为决策变量构建目标函数,同时以工作调休、

持续时长、班次时间等因素为约束条件。最后通过LINGO求解计算,得到最佳人员排

班方案见表15-16。

关键词:故障识别;集成机器学习;Stacking融合;因子分析;多目标线性规划

目录

1问题重述1

1.1研究背景1

1.2文献综述1

1.3研究选题1

2研究思路2

3模型假设3

4符号说明3

5数据的预处理4

5.1样本数据的处理4

5.2样本数据的结构优化7

6问题1:基于集成机器学习模型的装置故障识别方法研究11

6.1模型识别指标体系11

6.2基于特征融合网络的故障识别模型12

6.3Stacking融合技术

文档评论(0)

数学建模-赛道做 + 关注
实名认证
服务提供商

各类数学建模竞赛-文档,及优秀论文分享

1亿VIP精品文档

相关文档