- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘算法在水质评价预测中应用
数据挖掘算法在水质评价预测中应用
摘要:该文采用决策树、BP神经?W络、Logistic回归和基于径向基的RBF神经网络四种算法来建立水质评价预测模型,并对结果进行了分析。预测结果显示,基于径向基的RBF神经网络在四种算法中是最合适的方法,预测准确率较高,建议推广和使用。
关键词:神经网络;决策树;水质模型
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)35-0003-02
1 概述
水是人类赖以生存的重要物质,它是不可缺少、不可替代的重要资源。随着我国工业化进程的加快和经济的迅速发展,水污染日益严重已经成为制约我国实施可持续发展战略重要因素。水环境问题已经成为众多专家、学者研究的重点问题,目前国内外研究水环境质量的评价方法非常多,有关文献讨论水质评价的方法有几十种,呈现出非常活跃的态势。由于水环境中的各种元素的不确定性和水体的未知性,传统的确定性评价方法已经很难适应研究。有些水质模型虽考虑了影响水质变化的诸多因素,模拟预测效果较理想,但往往较复杂并需要大量基础资料和数据,使得研究的进一步开展和应用受到限制。而目前,较常见的情况是根据水体当前的水质情况、污染物的迁移特点和流域内污染物的排放情况来预测水质未来的变化趋势,为水质污染预测寻找一种合适的模型是非常必要。
2 相关理论分析
2.1 决策树
决策树是应用的最广的归纳推理算法之一,它是一种逼近离散值函数方法,对噪声有很好的健壮性且能够学习析取表达式。决策树一般都是自上而下的来生成的,并用了贪婪的搜索遍历方法进行遍历。每个决策或事件都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。常用的决策树算法包括CRT算法、ID3经典算法、C4.5算法、C5.0算法、CHAID算法、QUEST算法。
决策树的基本算法是贪心算法,它以自顶向下递归的各个击破方式构造决策树,最著名的决策树算法为ID3算法。ID3算法主要针对属性选择问题,是决策树学习方法中最具影响和最为典型的算法。该方法使用信息增益度选择测试属性。
2.2 基于径向基的RBF神经网
最基本的RBF神经网络的构成包括三层,分别为输入层、隐层(中间层)和输出层。其中输入层由一些源点(感知单元)组成,它们将网络与外部环境连接起来,仅起到数据信息的传递作用,对输入信息不进行任何变换;隐层神经元的核函数(或称作用函数)取为径向基函数,对输入信息到隐层空间之间进行非线性变换,通常具有较高的维数;输出层是线性的,为输入层的激活模式提供响应。
设隐层、输出层上的神经元数分别为,,输入模式记为,,输出记为,。本文取径向基函数为Gauss函数,隐单元输出则为
式中:为隐层第个神经元的输出值;为隐层第个神经元的中心,由隐层第个神经元对应于输入层所有神经元的中心分量构成,;为隐层第个神经元的宽度,与相对应;为欧氏范数。
输出层神经元的输入输出关系表达式是:
式中:为输出层第个神经元的输出值;为输出层第个神经元与隐层第个神经元间的权值。RBF神经网络的参数在此主要是指网络的中心、宽度、和调节权重。
3 实验过程
收集和提取一组用户基本数据,对数据进行预处理,如图1所示。
影响水质状态的指标主要有:1) 溶解氧(DO):衡量水体的自净能力(传感器网络自动采集);2)温度:水温随着天气的变化(传感器网络自动采集);3) PH值:反映水质的酸碱程度(传感器网络自动采集);4)氨氮:代表水中营养性污染物的含量(手持传感器手动采集);5)氧化还原电位(ORP):水溶液氧化还原能力的测量指标(手持传感器手动采集);6)当前环境因素(天气,水体环境状况)。其中1-250条记录为训练样本,251-300条记录为测试样本数据。通过建立各种模型来寻求一套最合适的评价方法,预测准确率较高的模型。
基于水质评价量化指标抽取DO、PH、NH、SD等四个关键指标,建立水体环境质量评价量化模型,实现水质智能化识别。依据依照《地表水环境质量标准》(GB3838-2002)中规定,地面水使用目的和保护目标,中国地面水分五大类:Ⅰ类―主要适用于源头水,国家自然保护区;Ⅱ类― 主要适用于集中式生活饮用水、地表水源地一级保护区,珍稀水生生物栖息地,鱼虾类产卵场,仔稚幼鱼的索饵场等;Ⅲ类― 主要适用于集中式生活饮用水、地表水源地二级保护区,鱼虾类越冬、回游通道,水产养殖区等渔业水域及游泳区;本文取前三类水质进行研究,对水质进行实时预测、分类和仿真。
3.1 利用决策树建立模型
利用决策树算法建立数据流,快速建立整体数据流图,决策树的核心算法采用CRT模型算法。此算法的优点是可以启用交互会话作
您可能关注的文档
最近下载
- 第8课 隋唐政治演变与民族交融-【中职专用】《中国历史》魅力课堂教学课件(高教版2023•基础模块).pptx VIP
- 人力资源管理开题(课题背景研究目的与意义【最新】.docx VIP
- 《生产调度与控制实务》课件.ppt VIP
- 2025水电工程信息分类与编码第4部分:水工建筑物.docx
- PMP项目管理培训课件项目.pptx VIP
- xx公司集团中铁工程部内部管理制度.doc VIP
- 2025年汽车驾驶员技师资格证书考试及考试题库含答案.docx
- 盐酸普鲁卡因工艺说明书8.pdf VIP
- 外研版小学三年级的英语第一单元试题.doc VIP
- 经济学原理(第8版)微观经济学曼昆课后习题答案解析.pdf
文档评论(0)