高校大数据挑战赛优秀论文A题论文220280.pdfVIP

  • 0
  • 0
  • 约3.46万字
  • 约 22页
  • 2026-02-10 发布于甘肃
  • 举报

高校大数据挑战赛优秀论文A题论文220280.pdf

所在组别参赛编号

2022年第二届中国高校大数据挑战赛

研究生组bdc220280

工业机械设备故障预测

摘要

制造业是国民经济的主体,在工业企业生产高度自动化和复杂化的今天,保障各个

生产环节的正常运转就显得尤为重要,机械设备的故障预测是首当其冲要解决的问题。

本文以某企业关于机械设备使用及故障发生情况的9000条记录为研究数据,数据

提供了机械设备的使用环境和工作强度等指标,包含室温、机械温度、转速、扭矩、运

转时长、机械的质量等级、是否发生故障以及故障类型等指标。

初步分析数据知,存在异常数据且正负样本比例约为29:1,为样本不均衡问题。

为避免样本不均衡导致的模型过拟合以及泛化能力差,针对不同的问题选取样本平衡方

法,再使用数据进行指标选取、故障预测建模以及因果分析。

问题一选择指标:需要选择合适的指标进行故障预测。首先删除了2条异常数据,

再采用过采样(SMOTE算法)的方法降低样本的类别不均衡度。将处理好的数据输入

决策树模型中进行重要度计算,按照重要度选择了:室温、转速、扭矩以及运转时长四

个指标用于故障预测。

指标名称机械质量等级室温机械温度转速扭矩运转时长

重要度0.018970.166940.076260.258520.290870.18842

问题二预测是否故障建模:需要根据历史数据训练模型用于预测未来是否发生故障。

首先对预处理过后的数据采用SMOTE算法和ADASYN方法分别进行样本平衡处理。

将处理好的数据按照8:2划分训练集和测试集输入袋装树模型中进行训练,采用网格

搜索的方法确定模型最佳参数,再采用五折交叉验证检验模型的性能。最后对比选用

ADASYN采样数据训练得到的袋装树模型,选取准确率、召回率、F1分数、精确率以

及AUC指标对模型进行评价,结果表明该模型的效果很好。相关指标数值见下表:

指标名称准确率召回率F1分数精确率AUC

值0.97650.96820.97620.98750.9900

问题三预测故障类型建模:需要根据历史数据训练模型用于预测未来发生故障的类

型,选择袋装树模型进行多分类预测。过程同问题二,最终选取Micro、Macro以及混

淆矩阵作为指标对模型进行评估,结果表明该模型的效果很好。相关指标数值见下表:

指标名称MicroMacro

值0.96520.9653

问题四模型应用:需要根据问题二和问题三训练出来的模型对文件中的数据进行仿

真预测,其中预测非故障与故障比例约为29.4:1。具体结果见附件“forecast.xlsx”。

问题五因果分析:需要对每类故障产生的原因进行量化分析。首先对自变量进行相

关性分析,剔除变量室温。将变量输入多项Probit模型中进行回归,分析总结了各个故

障可能的成因,结果见表11。再利用边际效应值进行量化分析,量化关系见式(11-15)。

关键词:样本不均衡二分类预测多分类预测因果分析模型评价

1

1问题重述

1.1问题背景

随着科学技术的发展,工业企业对机器设备的要求越来越多,智能生产线也正朝着

自动化和高集成的方向发展,复杂化和自动化是现在机械设备发展的较为突出的方向。

很多制造业的核心设备的自动化水平很高,机械设备在工业生

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档