- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2010年 7月 农 机 化 研 究 第 7期
数 据 挖 掘 技 术 在 农 业领 域 的应 用
刘春玲 ,崔凌云,贾冬青 ,郝 国芬 ,张焕生
(河北工程技术高等专 科学校 ,河北 沧州 061O01)
摘 要: 数据挖掘作为一项极具应用前景的技术 ,在处理农业领域积累的大量农业数据信息 中起着非常重要的
作用。为此 ,结合农业领域 的特点 ,系统综述 了聚类分析 、决策树 、关联规则 、粗糙集等主要数据挖掘技术在农业
中的应用现状 以及应用前景。
关键词:数据挖掘;农业信息;应用
中图分类号:S126 文献标识码 :A 文章编号:1003—188X(2010)07—0201—04
数据挖掘过程主要包括确定业务对象、数据准备、数
0 引言
据挖掘 、结果分析4个步骤。常用的数据挖掘方法有
信息化是一个国家和地区的经济增长能力、综合 聚类分析、决策树、关联规则、遗传算法、粗糙集等。
实力和竞争力的重要体现。加快农业信息化进程是推 1.1 聚类分析
动农业和农村经济发展 、农 民增收致富、农村社会稳 聚类是把一组个体按照相似性归纳成若干类别,
定的一项重要战略措施。随着计算机技术在农业生产 即 “物以类聚”。其 目的是使得属于同一类别的个体
中的广泛应用,农业科技人员获取、积累了大量与农 之间的距离尽可能小,而不同类别上的个体问的距离
业生产过程密切相关的属性数据和空间数据 ,这些数 尽可能大。利用聚类分析抽取学习样本 ,首先将数据
据真实、具体地反映了农业生产作业 的本质状况,是 集 划分为 个不相交 的 “类 ”,然后对这 个类 中
指导区域精准作业 的宝贵财富。但 由于农业生产的 的数据对象分别进行随机抽取,这样就可 以最终获得
复杂性,使得农业数据具有丰富、多维、动态、不完整、 聚类采样数据子集 。聚类方法包括统计方法、机器学
不确定等特性,导致 了我们 “淹没在数据 的海洋 中 , 习方法 、神经网络方法和面 向数据库的方法 。 目前,
数据丰富,知识贫乏”,所 以需要用一种方法从上述结 常用的聚类分析算法比较有代表性的有 K2MEANS算
构化和半结构化的大量数据 中找出隐藏的规律,根据 法、BIRCH算法、STNG算法、神经网络方法、DBSCAN
规律制定正确的农业策略,达到使农业生产持续 、高 算法等 。聚类分析算法常应用模式识别和空间数据
效、协调发展的 目的。数据挖掘技术 (DataMining, 分析等 。
DM)作为一种重要的数据处理和知识发现的技术,能 1.2 决策树
够有效地从农业信息数据中找出潜在的和有用的农 决策树是一棵树,树的根节点是整个数据集合空
业知识,为农业部 门的科学决策和知识管理提供支 间,每个分节点是对一个单一变量的测试,该测试将
持 ,因此 数据挖掘技术在农业领域 中有着,一阔的应用 数据集合空间分割成 2个或更多块 。每个 叶节点是
前景 。 属于单一类别 的记录。首先 ,通过训练集生成决策
树 ,再通过测试集对决策树进行修剪。决策树的功能
1 数据挖掘方法
是预言一个新的记录属于哪一类。决策树分为分类
数据挖掘就是利用各种分析工具在海量数据 中 树和回归树两种,分类树对离散变量做决策树,回归
发现模型和数据
文档评论(0)