数据挖掘方法与工具.pdfVIP

  • 8
  • 0
  • 约8.6千字
  • 约 2页
  • 2017-06-07 发布于河南
  • 举报
数据挖掘方法与工具

文章编号: ( ) 1002 - 252X 2005 03 - 0045 - 02 数据挖掘方法与工具 那嘉1, 王伟2 ( 黑龙江省气象局,黑龙江哈尔滨 ; 黑龙江省气象装备中心,黑龙江哈尔滨 ) 1. 150001 2. 150030 摘 要:数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程,这些 模型和关系可以用来做出预测。数据挖掘技术分类较多,主要根据模型与算法的不同。 关键词:数据挖掘;数据库;模型;预报模型 中图分类号: 文献标识码: TP301 B 1 引言 聚集是把整个数据库分成不同的群组。它的目的是要 随着数据库技术的迅速发展和管理系统的广泛应用, 群与群之间差别很明显,而同一个群之间的数据尽量相 许多领域搜集积累了大量的数据,数据背后隐藏了许多具 似。与分类不同在开始聚集之前,人们不知道要把数据分成 有决策意义的信息,为更好的利用这些数据,需要对其进行 几组,也不知道怎么分。聚集和分类是不同的,在分类之前, 更高层次的分析。目前,气象在国济民生中的作用占据了越 要已经知道要把数据分成哪几类,每个类的性质是什么,聚 来越明显的地位,气象部门每天海量数据信息的处理亟需 集则恰恰相反。 更高效的数据处理方法和技术。 3. 2 关联规则挖掘 目前数据库系统可以实现数据的更新,但无法发现其 关联规则挖掘是寻找在同一个事件中出现的不同项的 中存在的关系和规则,无法根据现有的数据预测未来的发 相关性,关联规则挖掘可以做如下形式描述: 展趋势,数据挖掘技术的产生,对解决此类问题有很大帮 设 { } … 是一个历史数据库, 表示 的第 T = t1, t2, tn ti T I 助。 条记录。以商业活动为例,交易数据库的字段包含两大部 2 什么是数据挖掘 分。第一部分不用来标记交易内容,一般不为布尔值,如记 数据挖掘是一个利用各种分析工具在海量数据中发现 录号( ) , TID 、交易时间、交易地点等。这部分字段记为A A = 模型和数据间关系的过程,这些模型和关系可以用来做出 { } … 。第二部分用来标记交易内容,字段值均为布 a1, a2, ar ( 预测。数据挖掘的第一步是描述数据计算统计变量 比如平 尔值,用于反应在某一次交易中,顾客是否购买了某个产 ) 均值、均方差等 ,再用图表或图片直观的表示出来,选择正 品。这部分字段记为 , … ,其中的元素称为项 I I = i1, i2, im 确的数据源对整个数据挖掘项目的成败至关重要。单单是 ( )。[

文档评论(0)

1亿VIP精品文档

相关文档