- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高技术通讯 200 1. 11
基于数据统计分析的知识发现①
②
柴 毅 黄席樾 李 佳 涂运华 何离庆
(重庆大学自动化学院 重庆 400044)
摘 要 以数据库中的数据为对象建立数据的统计模型 ,提出了一种定量统计分析方法 ,
对数据进行有序的组织 ,结合定性描述的归纳性知识 ,找出规律 ,形成可用于生产实践的
知识规则 。最后 ,用所提出的方法对农业生产数据进行了分析 ,归纳出生产管理的决策知
识用于指导生产 。
关键词 知识发现 , 统计分析 , 数据库
化的研究中要强调知识获取的通用性 、真实性和可
0 引言
靠性 。
在生产实践和社会生活中 ,无论是投入产出或 中国农业生产有着长期 、重复和家庭式耕作的
者是产品的质量 、数量等 ,都产生了大量的数据及丰 特点 ,加之农村中生产习惯等因素 ,一个村 ,甚至一
富的信息资料 ,在这些数据和资料中隐藏着各种有 个镇栽种品种 、操作管理方式差别不大 ,直接反映为
规律的信息和知识 。怎样对数据进行有序的分析 , 一个品种的农产品产量和质量会在一个时期维持相
找出规律 ,从大量低层次的原数据集中抽出高层次 对的稳定 。那么在长期的生产中 ,“生产操作有无问
的知识 ,形成可用于生产实践的知识规则就显得非 题 ? 该品种是否适合于在该地区生产 ?”等等问题 ,
常重要 。近年来 , 随着计算机技术和数据库技术的 就需要有科学的解答和指导 。因此 , 只有从大量农
( )
广泛应用 , 为数据 中的知识发现 KDD 提供了基 业生产数据中进行归纳发现知识 ,提供决策来指导
础 。 生产 。
数据挖掘可以从大量数据中提取出隐藏在数据 数据中的知识发现取决于大量数据的有序组织
之中的有用信息 ,基于数据库的知识发现是识别数 和归纳 。在农产品的产量和质量数据处理中 ,定量
据中有潜在规律 、有效的和最终可被理解的数据并 分析的方法是知识有效归纳获取的关键 ,通过定量
归纳和推理的过程 。各个领域都从不同的角度利用 的数学分析 ,对数据进行加工处理 ,运算求解 ,归纳
相应的理论和分析方法进行数据挖掘的研究和开发 出问题的本质 ,再经过定性分析 ,概括出知识 。因
工作 ,数据挖掘和知识发现所采用的方法涉及到机 此 ,知识的有效获取就取决于数据的有效组织和处
器学习、统计分析 、数据库分析 、模式识别 、神经网 理方式 。
络 、不确定性推理 、模糊逻辑和粗集理论等 。 由于农业生产数据的不精确 ,严格的数学归纳
本文以农业生产为对象 ,针对农业生产实践中 结果又不适用 ,所以归纳结果的有效程度取决于所
的品种 、产量 、质量等数据 ,利用数理统计的方法 ,处 使用的归纳算法和可以使用的数据集合 。
理偏差强化正例 ,发现农业生产管理知识 。 1. 2 作物生产数据描述
文档评论(0)