数据挖掘技术介绍.ppt

2002-6-2 数据挖掘:概念和技术 数据挖掘技术介绍 数据挖掘的发展动力 ---需要是发明之母 数据爆炸问题 数据自动收集工具和成熟的数据库技术使得大量的数据被收集,存储在数据库、数据仓库或其他信息库中以待分析。 数据极大丰富(data rich),知识极其匮乏(knowledge poor) 解决方法:数据仓库技术和数据挖掘技术 数据仓库(Data Warehouse)和在线分析处理(OLAP) 数据挖掘:在大量的数据中挖掘感兴趣的知识(规则,规律,模式,约束) 数据挖掘的案例:“啤酒”和“尿布” 一则广为流传的案例:啤酒和尿布的故事 美国加州某个超市连锁店发现: 在下班后前来购买婴儿尿布的顾客多数是男性,他们往往也同时购买啤酒。 处理:重新布置了货架,啤酒类商品、婴儿尿布、土豆片之类的佐酒小食品、男士们日常生活用品就近布置。 结果:上述几种商品的销量几乎马上成倍增长。 数据、信息、知识、理解和先知 系统学专家Russell Ackoff博士认为人类大脑包涵的内容,分为五类: 数据(Data):符号的集合,未加工、较为原始的形态 信息(Information): 数据经过处理后,有意义的,具有利用价值的,能够回答4W为(“who”,“what”,“where”,and “when”)等问题 知识(Knowledge): 实践中产生、经过实践检验的一种客观规

文档评论(0)

1亿VIP精品文档

相关文档