农业面源污染聚类分析.docVIP

下载本文档

21
0
约 6页
2016-09-11 发布于北京
举报
版权申诉

农业面源污染聚类分析.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

农业面源污染聚类分析.doc

农业面源污染聚类分析　　摘要：控制农业面源污染，保护农业生产环境具有重大意义。采用数据挖掘技术中的聚类Kmeans算法对2011年我国各地区农用化肥、农药、农膜、地膜、农用柴油以及畜禽粪尿排泄使用密度进行聚类分析，结果显示全国有15个省份属于畜禽养殖重污染区域，13个省份属于农资污染偏高，畜禽养殖污染偏低区域，4个省份属于农资污染严重区域，从结果中了解到了各地农业面源污染形成的原因，能够辅助农业面源污染的预防和治理。　　关键词：农业面源污染；数据挖掘；聚类算法　　中图分类号： TP301 文献标识码：A 文章编号：1009-3044（2014）25-5988-03 　　1 概述　　长期以来，我国农业生产为了提高产量，大量使用化肥、农药等投入品，引发了严重的农业面源污染，破坏了农业生态环境，制约了农业经济社会的可持续发展，引起了我国政府的高度重视，并在《国民经济和社会发展第十一个五年规划纲要》明确提出要“防治农药、化肥和农膜等面源污染”[1]。农业面源污染，又称农业非点源污染，也称农业扩散性污染，是指在农业生产活动中，氮素和磷素等营养物质、农药以及其它有机或无机污染物通过农田的地表径流和农田渗漏造成水环境的污染，主要包括化肥污染、农药污染、畜禽养殖污染[2]。农业面源污染的特点是面广、分散、隐蔽、来源多、增长快、处理率低。　　聚类分析是多元统计分析方法中的一种，是非监督模式识别的一个重要分支。聚类是按照事物的某些属性，把事物聚集成簇，使簇内的对象之间具有较高的相似性，而不同簇的对象之间的相似程度较差。采用数据挖掘的聚类技术从现有的农业生产中关于化肥、农药、农膜的投入以及畜禽污染物排泄的数据中获取相关知识，以加强对农业面源污染的形成原因进行更加全面的认识，辅助快速而有效的控制面源污染，便于农业面源污染的预防和治理。　　2 材料与方法　　2.1 数据来源　　数据来源于2013年中国农村统计年鉴[4]和2012年中国农业年鉴[5]。针对造成农业土壤污染的污染面源，选取化肥使用密度、农药使用密度、农膜使用密度、地膜使用密度、农用柴油使用密度和畜禽粪尿排泄密度六项项指标进行测算，其中化肥、农药、农膜、地膜和柴油使用密度这 5 项指标分别用农作物单位耕地面积的化肥使用量、农药使用量、农膜使用量、地膜使用量和柴油使用量来表示。畜禽粪尿排泄密度用农作物单位面积的畜禽粪尿排放量表示，其中畜禽粪尿排放量用畜禽年末出栏数量和年排泄系数[6]的乘积来表示，处理后的数据如表1所示。　　2.2 聚类技术Kmeans算法　　聚类通常指一个类簇内的实体是相似的，不同类簇的实体不相似；一个类簇是测试空间中点的会聚，同一类簇的任意两个点间的距离小于不同类簇的任意两个点间的距离。类簇可以描述为一个包含密度相对较高的点集的多维空间中的连通区域 [7]。聚类算法的选取主要取决于所研究数据的类型、聚类的目的和应用等。聚类算法大致上可分为层次聚类算法、划分式聚类算法、基于密度的聚类算法、基于网格的聚类算法、基于模型的聚类算法等[8]。　　Kmeans算法是一种基于划分的聚类算法，它通过不断的迭代过程来进行聚类，当算法收敛到一个结束条件时就终止迭代过程输出聚类结果。该算法的基本流程：先指定需要划分的簇的个数k值；然后随机地选择几个初始数据对象点作为初始的聚类中心；第三，计算其余的各个数据对象到这个初始聚类中心的距离，把数据对象划归到距离它最近的那个中心所处在的簇类中；最后，调整新类并且重新计算出新类的中心，如果两次计算出来的聚类中心未曾发生任何的变化，那么就可以说明数据对象的调整已经结束，也就是说聚类?用的准则函数是收敛的，算法结束[9]。　　2.3 数据处理　　利用Weka软件，采用Kmeans聚类算法，对表1的数据进行聚类处理，得到的挖掘结果如下所示：　　kMeans 　　Number of iterations： 3 　　Within cluster sum of squared errors： 4.435785382426557 　　Missing values globally replaced with mean/mode 　　Cluster centroids：　　Attribute Full Data ① 第1类包含15个省份，这些省份单位面积畜禽粪尿排放密度（均值20167.0667）很高，而其他污染面源使用密度较低。　　② 第2类包含12个省份，这些省份农用化肥使用密度很高（均值646.275），农药使用密度（均值22.3725）偏高，地膜使用密度（均值96.0375）偏低，其余污染面源均在全国平均水平。　　③ 第3类包含4个省份，这一区域单位面积畜禽粪尿排放密度（均值