数据挖掘26207.pptVIP

  • 1
  • 0
  • 约7.88千字
  • 约 55页
  • 2016-12-08 发布于江西
  • 举报
数据挖掘 什么是数据挖掘? 数据挖掘的步骤 数据挖掘的主要功能 概念/类描述:特征化和区分 关联分析 分类和预测 聚类分析 孤立点分析 演变分析 在何种数据上进行数据挖掘 数据挖掘技术的前景 实例: 中文Web搜索引擎日志挖掘 数据挖掘的发展动力 ---需要是发明之母 数据爆炸问题 数据自动收集工具和成熟的数据库技术使得大量的数据被收集,存储在数据库、数据仓库或其他信息库中以待分析。 数据极大丰富(data rich) ,知识极其匮乏(knowledge poor) 解决方法:数据仓库技术和数据挖掘技术 数据仓库(Data Warehouse)和在线分析处理(OLAP) 数据挖掘:在大量的数据中挖掘感兴趣的知识(规则,规律,模式,约束) 数据挖掘的案例:“啤酒”和“尿布” 一则广为流传的案例:啤酒和尿布的故事 美国加州某个超市连锁店发现: 在下班后前来购买婴儿尿布的顾客多数是男性,他们往往也同时购买啤酒。 ?? 处理:重新布置了货架,啤酒类商品、婴儿尿布、土豆片之类的佐酒小食品、男士们日常生活用品就近布置。 ?? 结果:上述几种商品的销量几乎马上成倍增长。 数据、信息、知识、理解和先知 系统学专家Russell Ackoff博士认为人类大脑包涵的内容,分为五类: 数据(Data): 符号(Symbols )的集合,未加工、较为原始的形

文档评论(0)

1亿VIP精品文档

相关文档