第3章数据挖掘.PDFVIP

  • 3
  • 0
  • 约3.48万字
  • 约 20页
  • 2019-01-09 发布于天津
  • 举报
第3章数据挖掘

第 3 章 数 据 挖 掘 过程挖掘建立在两大支柱上:(a )过程建模与分析(如第 2 章所述)和(b )数据挖掘。 本章将介绍数据挖掘领域及其基本方法。本章包括两方面:一方面,一些过程挖掘技术建 立在传统的数据挖掘技术之上,例如发现和改进的方法关注于数据和资源;另一方面,源 于数据挖掘领域的想法可以被用于过程挖掘结果评价,例如可以将各种数据挖掘方法用于 度量被发现和改进的过程模型的质量。现有的数据挖掘技术对于控制流发现、合规性检测 和其他过程挖掘任务的直接作用并不大,然而,对数据挖掘的基本理解,对于深入理解本 书后续章节介绍的过程挖掘技术有很大的帮助。 3.1 数据挖掘技术的分类 在文献[74]中,数据挖掘的定义是“通过对(通常是大量的)数据集进行分析,发现 潜在的数据关系,用易于理解的、能被数据所有者使用的新方式对数据进行概括”。数据挖 掘的输入数据通常是表格,输出可以是规则、簇、树结构、图、方程式和模式等。第 1 章 描述的“数字世界”的快速增长是普及数据挖掘的主要推动力。最初,“数据挖掘”一词含 有负面意义,尤其是在统计学家之间,诸如“数据窥探”、“钓鱼”和“数据捕捞”一类的 术语是指从没有完全统

文档评论(0)

1亿VIP精品文档

相关文档