第数据挖掘精读.pptVIP

  • 3
  • 0
  • 约4.54千字
  • 约 25页
  • 2016-08-24 发布于湖北
  • 举报
学习目标 学习目标 3.1.1数据挖掘的定义和内涵 从技术的角度来说,数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 3.1.1数据挖掘的定义和内涵 从商业的角度来说,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。 1)关联分析 2)序列模式分析 3)分类分析 4)聚类分析 1)关联分析 关联分析是挖掘表面看似独立的事件间的相互关系。例如“90%的顾客在一次购买活动中购买商品A的同时购买商品B”之类的知识。 【业务链接3-1】尿布和啤酒 全球最大的零售商沃尔玛(Walmart)通过对顾客购物的数据分析后发现,很多周末购买尿布的顾客也同时购买啤酒。经过深入研究后发现,美国家庭买尿布的多是爸爸。爸爸们下班后要到超市买尿布,同时要“顺手牵羊”带走啤酒,好在周末看棒球赛的同时过把酒瘾。后来沃尔玛就把尿布和啤酒摆放得很近,从而双双促进了尿布和啤酒的销量。这个经典的“尿布和啤酒”的故事被公认是商业领域数据挖掘的诞生。这里就是利用关联分析这种方法,发现两种商品之间有很高的相关系数,引起重视,然后深入分析后才找出内在原因的。 2)序列模式分析 它与关联分析相

文档评论(0)

1亿VIP精品文档

相关文档