腾讯大讲堂59-数据蕴含商机,挖掘决胜千里-精品·公开课件.pptVIP

  • 2
  • 0
  • 约5.24千字
  • 约 39页
  • 2018-11-05 发布于广西
  • 举报

腾讯大讲堂59-数据蕴含商机,挖掘决胜千里-精品·公开课件.ppt

数据蕴含商机,挖掘决胜千里 Agenda 从运筹帷幄到决胜千里… 观日月之行,察天地之变 数据爆炸的时代 数据挖掘是…… 多学科的融合 Agenda 几个基本概念 模型(Model) vs 模式(Pattern) 数据挖掘的根本目的就是把样本数据中隐含的结构泛化(Generalize)到总体(Population)上去 模型:对数据集的一种全局性的整体特征的描述或概括,适用于数据空间中的所有点,例如聚类分析 模式:对数据集的一种局部性的有限特征的描述或概括,适用于数据空间的一个子集,例如关联分析 算法(Algorithm):一个定义完备(well-defined)的过程,它以数据作为输入并产生模型或模式形式的输出 描述型挖掘(Descriptive) vs 预测型挖掘(Predictive) 描述型挖掘:对数据进行概括,以方便的形式呈现数据的重要特征 预测型挖掘:根据观察到的对象特征值来预测它的其他特征值 描述型挖掘可以是目的,也可以是手段 数据挖掘是一个过程 数据挖掘方法论 CRISP_DM (Cross Industry Standard Process for DM) 1998年,由NCR、Clementine、OHRA和Daimler-Benz的联合项目组提出 SEMMA SAS公司提出的方法 Sample, Explore, Modify, Model, Asse

文档评论(0)

1亿VIP精品文档

相关文档