第三章 数据挖掘的方法论.pptVIP

  • 6
  • 0
  • 约1.49千字
  • 约 14页
  • 2017-09-05 发布于江苏
  • 举报
第3章 数据挖掘方法论 数据挖掘将商业需求和所需要的数据联系在一起,它是对客户和商业前景的理解,理解产品和市场,理解供货方和合作伙伴,理解销售的全过程,并用数据将他们整合到一起。为了成功运用数据挖掘,对数据挖掘技术层面的理解至关重要,尤其是应该了解如何将数据变成有用信息的过程。 数据挖掘方法论CRISP-DM和SEMMA CRISP-DM(CRoss-Industry Standard Process for Data Mining)即为”跨行业数据挖掘过程标准”,该模型将一个KDD工程分为6个不同的,但顺序并非完全不变的阶段:。CRISP-DM 模型在各种KDD过程模型中占据领先位置,采用量达到近60%。 SAS数据挖掘方法论 ─ SEMMA SAS将数据挖掘过程看成5个阶段 Sample ─数据取样 Explore ─数据特征探索、分析和预处理 Modify ─问题明确化、数据调整和技术选择 Model ─模型的研发、知识的发现 Assess ─模型和知识的综合解释和评价 CRISP-DM与SEMMA的区别 CRISP-DM是从数据挖掘项目执行的角度谈方法论,SEMMA 则是从对具体数据集的一次探测和挖掘的角度来谈方法论, CRISP- DM的考虑的范围比SEMMA 要大。CRISP-DM关注商业目标、数据的获取和管理, 以及模型在商业背景下的有效性; SEM

文档评论(0)

1亿VIP精品文档

相关文档