机器学习与数据挖掘复习.docxVIP

  • 13
  • 0
  • 约9.93千字
  • 约 14页
  • 2017-08-20 发布于安徽
  • 举报
PAGE14 / NUMPAGES14 机器学习与数据挖掘复习 第一章:Introduction 1. 什么是数据挖掘:数据挖掘时从大量的数据中取出令人感兴趣的知识(令人感兴趣的知识:有效地、新颖的、潜在有用的和最终可以理解的)。 2. 数据挖掘的分类(从一般功能上的分类): 描述型数据挖掘(模式):聚类,summarization,关联规则,序列发现。 预测型数据挖掘(值):分类,回归,时间序列分析,预测。 3. KDD(数据库中的知识发现)的概念:KDD是一个选择和提取数据的过程,它能自动地发现新的、精确的、有用的模式以及现实世界现象的模型。数据挖掘是KDD过程的一个主要的组成部分。 4. 用数据挖掘解决实际问题的大概步骤: 对数据进行KDD过程的处理来获取知识。 用知识指导行动。 评估得到的结果:好的话就循环使用,不好的话分析、得到问题然后改进。 5. KDD过程中的角色问题: 6. 整个KDD过程: 合并多个数据源的数据。 对数据进行选择和预处理。 进行数据挖掘过程得到模式或者模型。 对模型进行解释和评价得到知识。 第二章 数据和数据预处理 1. 什么是数据:数据是数据对象和它的属性的集合。一个属性是一个对象的性质或特性。属性的集合描述了一个对象。 2. 属性的类型: 标称(nominal):它的值仅仅是不同的名字,只是提供足够的信息来区分对象。例如邮政编

文档评论(0)

1亿VIP精品文档

相关文档