- 13
- 0
- 约9.93千字
- 约 14页
- 2017-08-20 发布于安徽
- 举报
PAGE14 / NUMPAGES14
机器学习与数据挖掘复习
第一章:Introduction
1. 什么是数据挖掘:数据挖掘时从大量的数据中取出令人感兴趣的知识(令人感兴趣的知识:有效地、新颖的、潜在有用的和最终可以理解的)。
2. 数据挖掘的分类(从一般功能上的分类):
描述型数据挖掘(模式):聚类,summarization,关联规则,序列发现。
预测型数据挖掘(值):分类,回归,时间序列分析,预测。
3. KDD(数据库中的知识发现)的概念:KDD是一个选择和提取数据的过程,它能自动地发现新的、精确的、有用的模式以及现实世界现象的模型。数据挖掘是KDD过程的一个主要的组成部分。
4. 用数据挖掘解决实际问题的大概步骤:
对数据进行KDD过程的处理来获取知识。
用知识指导行动。
评估得到的结果:好的话就循环使用,不好的话分析、得到问题然后改进。
5. KDD过程中的角色问题:
6. 整个KDD过程:
合并多个数据源的数据。
对数据进行选择和预处理。
进行数据挖掘过程得到模式或者模型。
对模型进行解释和评价得到知识。
第二章 数据和数据预处理
1. 什么是数据:数据是数据对象和它的属性的集合。一个属性是一个对象的性质或特性。属性的集合描述了一个对象。
2. 属性的类型:
标称(nominal):它的值仅仅是不同的名字,只是提供足够的信息来区分对象。例如邮政编
您可能关注的文档
- 2014年度贵州省公务员普法考试参考答案.docx
- 2014年福建省公务员考试行测模拟卷.docx
- 2014年云南中学教师资格考试信息技术基础强化练习五.docx
- 2014秋第二协作区八年级地理期中联考试题1.docx
- 2014注会考试审计考前冲刺建议.docx
- 2015年考研数学(三)真题及答案详解.docx
- HL数字控制编程系统使用说明.docx
- 财税专业技能等级考试(ATT)从业级模拟试卷.docx
- 成考英语重难点复习笔记.docx
- 地下建筑与结构模拟题.docx
- 力士乐数控系统MTX NC固定循环.docx
- 发格数控系统40_i_P数显表安装操作手册.docx
- T∕SDJZXH 005-2025 建设工程智慧监理建设评价标准.pdf
- FANUC发那科数控系统FANUC OPEN CNC 操作说明书(DNC 运行管理软件.docx
- T∕CASMES 661-2026 停车场(库)公共设施配建导则.pdf
- T∕GZBECTA 007-2025 民用建筑碳排放计算指南.pdf
- FANUC发那科数控系统16i 18i 160i 180i - Model A Maintenance.pdf
- T∕CADP 9-2023 高路堤路段与天然气管道交叉工程 通道涵技术要求.pdf
- 发格数控系统8055参数备份和恢复.pdf
- Mazak马扎克数控系统马扎克(Mazak)FMS介绍.docx
原创力文档

文档评论(0)