基于智能化多元线性回归方法的汇流入口工业污水指标预测.pptVIP

基于智能化多元线性回归方法的汇流入口工业污水指标预测.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于智能化多元线性回归方法的汇流入口工业污水指标预测 报告人: 高 翔 引 言 部 分 问题的提出 汇流问题:多个(12个)排污源(点源),一个入口(污水处理厂). 预测要求和条件:通过当值班次12股污水汇报的水量Q和COD浓度值(指标),预报即将到达的污水入口的Q和COD值. 隐含已知:前几个班次的点源指标和入口指标,可以用于建模和预测. The sketch of confluent flow network 预测存在的问题(1) 不似某些流域问题,没有现成的模型可以使用. 每个班次各点源测量的是一个小时的Q和COD,而污水厂测量的是八小时的Q和COD. 污染排放指标不是平均的,而是时时会有变化.所以不能输入输出之间关系简单视为线性系统. 某些点源甚至某阶段零排放. 各排放点源测量时间都不统一,按照各自的习惯.相互相差甚至两,三个小时. 预测存在的问题(2) 各点源距离污水厂的地理位置远近不同. 可能有未知点源存在,动态干扰和测量误差,影响入口的Q和COD预测. 入口的Q和COD不能按照质量关系平衡式,依简单的各点源对应指标加和来计算. 问题不确定性太多,似乎无解. 探索可实现的方法(1) 由于系数为1的加和关系不存在,怀疑各点源之间存在相关关系.但是考虑到水量Q质量平衡,负荷QCOD物质平衡,希望用各算法找出各点源的加和系数(权值) 开始使用主元回归(PCR, Principal Component Analysis),预测COD无法保证精度.总是怀疑未知点源的作用和非线性因素.曾设Q0,COD0,仿真效果不好,且负系数的物理意义解释有问题. 尝试使用偏最小二乘(PLS, Partial Least Square),算法比PCR复杂,仿真效果几乎没有提高. 探索可实现的方法(2) 考虑非线性的基于偏差的二项式偏最小二乘算法(error-based quadric PLS),仿真效果仍不理想. 亦作好尝试岭回归,支持向量机回归等非线性方法的准备. 对各变量(点源)的数据计算相关程度corr,发现相关性差.果断舍弃各多元相关方法. 重新回到线性回归的思路.将Q和COD分开考虑,降低非线性程度. 一种建设性的尝试方法 先是用最小二乘求出了各点源的系数. 将入口指标表示为上一班次的指标和各点源指标增量的加权系数之和,再进行一次最小二乘. 对于两次最小二乘的解释并不算完备,动态变化适应性也不太好.不过 “最小二乘”, “上一班次”, “增量”对后来的算法有建设意义.而且,计算中一小时和八小时数量对应关系算法中得以免于考虑. 各点源和入口指标的对应关系 结论:弱非线性,观察多个班次的历史记录,可以简单化视为随班次变动,摆动的输入输出线性关系. 众点源与入口的非线性关系表示: 泰勒多项式展开: 可以保留常数项和一次项: 可以看出, 只需要求各点源的常数项之和即可. 后续的F检验可以验证线性近似选择的正确. 基于测量值建模和预测 最小二乘求解 偏回归系数计算 当然,偏回归系数是各班次输入点源和输出入口的线性关系的折衷.不可能包括各种情况,如需精确,可按下面的递归遗忘因子最小二乘. 理想当前的入口指标的预测值. 当然,关键问题是当前的回归系数未知.需要开发一种预测算法. 拟合优度测试(MLR统计检验之一) 首先介绍三个统计量: 总变差平方和 残差平方和 回归平方和 相关系数平方 越接近1,拟合曲线(或直线)离散点越近,拟合效果越好. 方程显著性检验(MLR统计检验之二) F检验,输入变量和输出线性关系是否显著. 原假设: 备择假设:至少有一个θ(i) 不为零. 数理统计知识:回归平方和和残差平方和相互独立,原假设为真时: 在给定显著性水平φ 下,若 则拒绝原假设,回归效果显著,线性关系存在,否则,不显著. 变量显著性检验(MLR统计检验之三) t检验,原假设和备择假设 偏回归系数的估计值,服从正态分布: Cii是对角阵(HTH)-1的对应元素. 如果原假设为真,有: 在给定显著性水平φ 下,若 拒绝原假设,变量回归效果显著.否则不显著(可删). 引申含义:未知点源,干扰等数值应很小,既然计算中某些数量值小点源变量可以删去(不用删),那么推知未知量不会影响算法的精度. 改进的递归遗忘因子最小二乘 Improved RFFLS 目的:由于普通最小二乘(OLS)归纳出的偏回归系数只能是面向建模时的班次的数据情况普遍性,不能考虑新班次的数据特殊性.递归是解决这个问题的方法. 遗忘因子:数据增加,最小二乘面临 “数据饱和”现象,算法失去修正能力,时变系统参数估计值不能跟踪时变参数的变化. 改进方法:在增益阵K前面加上乘数η,使算法的偏回归系数能够更及时地跟上系统的

文档评论(0)

小玉儿 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档