2021五一杯c题数据驱动的异常检测与预警问题.pdfVIP

2021五一杯c题数据驱动的异常检测与预警问题.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2021五⼀杯c题数据驱动的异常检测与预警问题 2021五⼀杯C题数学建模 数据驱动的异常检测与预警问题 推动⽣产企业⾼质量发展, 根本的底线是保证安全、防范风险,⽽⽣产过程中产⽣的数据能够实时反映潜在的风险。附件 1为某⽣产企业 某 ⽇00:00:00-22:59:59由⽣产区域的仪器设备记录的时间序列数据 (已经进⾏数据脱敏),本题未给出数据的具体名称,这些数据可能 是温度、浓度、压⼒等与安全密切相关的数据。 请依据附件 1数据,建⽴数学模型,完成以下问题 : 问题 1:附件 1所给出的数据都可能存在波动,且所有波动都在安全值范围内。有些波动可能是正常性波动,例如随着外界温度或者产量变 化的波动,或者可能是传感器误报,这些波动具有规律性、独⽴性、偶发性等特点,并不能产⽣安全风险,我们视为⾮风险性异常,不需要 ⼈为⼲预 ;有些波动具有持续性、联动性等特点,这些异常性波动的出现是⽣产过程中的不稳定因素造成的,预⽰着可能存在安全隐患,我 们视为风险性异常,需要⼈为⼲预、分析和评定风险等级。请建⽴数学模型,给出判定⾮风险性异常数据和风险性异常数据的⽅法。 问题2 :结合问题 1的结果,建⽴数学模型,给出风险性异常数据异常程度的量化评价⽅法,要求使⽤百分制 (0- 100分)对每个时刻数据 异常程度进⾏评价 (分值越⾼表⽰异常程度越⾼)。应⽤所建⽴的模型和附件 1的数据,找到数据中异常分值 ⾼的5个时刻及这5个时刻对 应的异常传感器编号 (每个时刻只填写5个异常程度 ⾼的传感器编号,异常传感器不⾜5个则⽆需填满 ;如果得分为0,可以不⽤填写异常 传感器编号),并给出数学模型对所得结果进⾏评价。 问题3 :为了提前发现未来⽣产过程中可能存在的风险隐患,请建⽴风险性异常预警模型,预测当⽇23:00:00-23:59:59可能产⽣的风险 性异常。结合问题2中给出的风险性异常程度量化评价⽅法,指出23:00:00-23:59:59中四个时间段 (见表2),每个时间段内的 ⾼异常 分值及对应的异常传感器编号 (只填写5个异常程度 ⾼的传感器编号,异常传感器不⾜5个则⽆需填满 ;如果得分为0,可以不⽤填写异常 传感器编号)。 问题4 :根据问题2和问题3中的结果,建⽴数学模型对该⽣产企业整个⽣产系统的安全性进⾏评价,请在00:00:00-23:59:59内每隔30分 钟,⽤0- 100分进⾏安全性评分,0分表⽰安全性 低,100分表⽰安全性 ⾼ (包括00:00:00-23:00:00的得分和23:00:00-23:59:59 的预测得分),并⽤适当的⽅法对所给评分的结果进⾏评价和敏感性分析。 模型的建⽴与求解(部分): 为了按照真实的⽐重给各个波动的主成分,需要使⽤临近分析法对主成分进⾏加权,NCA 是⼀种基于邻域分量的特征选择⽅法,在有监督 的机器学习⽅法中,通过 NCA 多步跌代算法对⽤于分类的特征向量进⾏分析,以此获得不同的特征向量的分类中的权重⼤⼩,可根据权重 的⼤⼩对原始的特征向量进⾏进⼀步筛选,进⼀步对数据进⾏降维,对整个训练⽹络进⾏优化。在第⼀问中我们已经通过 PCA 降维算法对 传感器数据进⾏了排序和权重计算,在本问中进⼀步 利⽤ NCA 对影响恐怖袭击等级的特征向量的排序和权重进⾏进⼀步的讨论,以此来得 出风险性异常数据异常程度的量化评价⽅法。 Matlab 20 18 有⽤于 NCA 近邻分析的⼯具箱,函数命令为 fscnca(x,y),其中 x 代表特征向量,y 代表样本标签 (权重),因为 NCA 是 ⼀种迭代算法,在进⾏运算时需要对⼀些参数进⾏设置,包括迭代⽅法, ⼩批量处理等。考虑到样本的数量和计算精度的要求,对 NCA 计算参数的设置如下,为提⾼计算精度⽹络的迭代⽅式采⽤ SGD 随机梯度下降的计算⽅式, ⼩计算批量 (MiniBatchSize)为 50, PassLimitd 等于 10,调谐⼦集合为 150,迭代周期为 20。⽹络运⾏迭代过程中 loss 不断减⼩,直到稳定达到误差要求。其迭代过程如下图所⽰ : 程序代码 import math import random random.seed(0) def rand(a,b) : #随机函数 return (b-a)*random.random()+a def make_ matrix(m,n,fi =0.0) :#创建 ⼀个指定⼤⼩的矩阵 mat = [] for i in range(

文档评论(0)

139****2545 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档