数据仓库与数据挖掘技术 第5章.ppt

第5章 数据挖掘过程 主要内容 数据挖掘的基本流程是怎样的? 如何确定和定义数据挖掘任务? 什么是数据预处理?(重点) 如何建立和理解数据挖掘模型? 数据挖掘中有哪些常见的问题? 1.数据挖掘的基本流程是怎样的? 企业挖掘器 数据挖掘的方法论——SEMMA SAS的SEMMA方法,即抽样(Sample),探索(Explore),修改(Modify),模型(Model),评价(Assess) 数据挖掘过程模型是为应用数据挖掘技术提供一种系统化的技术实施方法。由于数据挖掘的应用领域极其广泛、应用问题的类型也较多,因此,为了成功的应用数据挖掘技术,围绕数据挖掘过程需要涉及: 问题的理解 数据的理解、收集和准备 建立数据挖掘模型 评价所建的模型 应用所建的模型等 数据挖掘的基本流程 数据挖掘的方法论——CRISP-DM CRISP-DM(Cross-Industry Standard Process-Data Mining) CRISP是当今数据挖掘业界通用流行的标准之一 它强调数据挖掘在商业中的应用,解决商业中存在的问题,而不是把数据挖掘局限在研究领域 2.如何确定和定义数据挖掘任务? 对数据挖掘查询的说明 我想挖掘什么数据集 数据挖掘研究的范围 想挖掘什么类型的知识 什么背景知识在这里可能有用 哪些度量可以用来评估模式的兴趣度 了解研究主题的局限

文档评论(0)

1亿VIP精品文档

相关文档