数据挖掘基本概念解说(1)培训资料.pptVIP

  • 8
  • 0
  • 约1.37千字
  • 约 22页
  • 2021-09-22 发布于浙江
  • 举报
目 录;一、数据挖掘的基本概念;1.知识发现(Knowledge-Discovery in Databases,简称:KDD) 知识发现(KDD:Knowledge Discovery in Database)是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。 知识发现就是从数据源中抽取感兴趣的数据,并把这些数据组织成符合挖掘的组织形式,然后利用相应的算法、模型生成想要的知识模式,最后对生成的知识模式进行评估,并把有价值的知识集成到应用系统当中。 ;2.数据挖掘的概念 数据挖掘,英文称为 Data mining,又称为资料探勘、数据采矿等等。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。 数据挖掘是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。 数据挖掘是从大量的、不完全的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。;3.数据挖掘的发展历史;4.数据挖掘基本流程;4.数据挖掘基本流程;二、数据挖掘的方法分类;1.几种简单的数据挖掘方法 分类 (Classification) 聚类(Clustering) 回归分析(Regression analysis) 关联规则(Affinity grouping or association rules) 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等);2.分类(Classification) C4.5 (基于决策树改进的算法) CART(分类回归树) SVM(支持向量机) AdaBoost(集成学习算法) kNN(K近邻算法,k-NearestNeighbor) Naive Bayesian(朴素贝叶斯);2.分类(Classification) kNN(K近邻算法,k-NearestNeighbor);3.聚类(Clustering) (1)划分方法 (2)层次的方法 (3)基于密度的方法 (4)基于网格的方法 (5)基于模型的方法 经典算法:K-means(K均值);4. 回归分析(Regression analysis) 回归分析是一个统计预测模型,用以描述和评估因变量与一个或多个自变量之间的关系,反映的是变量或属性间的依赖关系。 线性回归 多项式回归 逻辑回归;5.关联规则(Affinity grouping or association rules) 关联规则最初提出的动机是针对购物篮分析(Market Basket Analysis)问题提出的。 关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 。其中,关联规则XY,存在支持度和信任度。 关联规则中最经典的算法:Apriori算法;5.关联规则(Affinity grouping or association rules);二、数据挖掘方法分类;三、数据挖掘案例;三、数据挖掘案例;三、数据挖掘案例; 谢谢!;

文档评论(0)

1亿VIP精品文档

相关文档