CN107480839-CN201710951078-基于主成分分析和随机森林的高危污染源的分类预测方法.pdfVIP

CN107480839-CN201710951078-基于主成分分析和随机森林的高危污染源的分类预测方法.pdf

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN107480839-CN201710951078-基于主成分分析和随机森林的高危污染源的分类预测方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 107480839 A (43)申请公布日 2017.12.15 (21)申请号 201710951078.5 G06Q 50/26(2012.01) G06F 17/30(2006.01) (22)申请日 2017.10.13 (71)申请人 深圳市博安达信息技术股份有限公 司 地址 518000 广东省深圳市南山区高新区 中区科研路9号比克科技大厦14层 1401室 (72)发明人 康庆 罗艳 唐文超 庞东博  王登优  (74)专利代理机构 北京科亿知识产权代理事务 所(普通合伙) 11350 代理人 汤东凤 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) 权利要求书2页 说明书9页 附图11页 (54)发明名称 基于主成分分析和随机森林的高危污染源 的分类预测方法 (57)摘要 本发明公开了一种基于主成分分析和随机 森林的高危污染源的分类预测方法,包括:采集 企业的污染源环境行为数据并整合形成初选指 标,筛选出影响污染源违法的污染源行为指标作 为高危污染源指标体系;对污染源环境行为数据 进行数据清洗和数据归一化处理;找出高危污染 源指标体系与污染源是否违法之间的函数关系, 建立随机森林模型;进行模型训练,并在训练结 束后评估随机森林模型的精度;对污染源行为指 标的重要性程度进行排序;进行主成分分析获得 主成分,利用主成分进行加权,计算出综合得分; A 根据综合得分判断各个企业发生违法行为的风 9 险得分系数,将风险得分系数自动排名,生成TOP 3 8 0 企业名单。本发明能降低操作复杂度、提高预测 8 4 7 精度和结果质量。 0 1 N C CN 107480839 A 权 利 要 求 书 1/2页 1.一种基于主成分分析和随机森林的高危污染源的分类预测方法,其特征在于,包括 如下步骤: A)从污染源各业务数据库中采集收录的企业的各种污染源环境行为数据,对所述污染 源环境行为数据进行整合形成初选指标,从所述初选指标中筛选出影响污染源违法的污染 源行为指标作为高危污染源指标体系,所述高危污染源指标体系构成指标数据集; B)对所述高危污染源指标体系中的污染源环境行为数据进行数据清洗和数据归一化 处理; C)找出所述高危污染源指标体系与污染源是否违法之间的函数关系,建立随机森林模 型; D)对所述随机森林模型进行训练,并在训练结束后通过所述随机森林模型在所述指标 数据集上的分类准确率,对所述随机森林模型的精度进行评估; E)使用所述随机森林模型预测未来会发生违法行为的企业名单,并对所述污染源行为 指标的重要性程度进行排序; F)对所述污染源行为指标进行主成分分析获得主成分,利用所述主成分进行加权,计 算出综合得分; G)根据所述综合得分判断未来各个企业会发生违法行为的风险得分系数,并将每个所 述风险得分系数按照危险系数从高到低的顺序进行自动排名,生成TOP企业名单。 2.根据权利要求1所述的基于主成分分析和随机森林的高危污染源的分类预测方法, 其特征在于,所述污染源行为指标包括排污废水超量倍数、排污污染物超标数、缴费超时时 长、在线报警次数、行政

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档