- 2
- 0
- 约2.97千字
- 约 32页
- 2016-08-23 发布于湖北
- 举报
数据仓库-数据分类
数据仓库与数据挖掘 第7章 数据分类 7.1 引例 分类的定义 分类是指把数据样本映射到一个事先定义的类中的学习过程,即给定一组输入的属性向量及其对应的类,用基于归纳的学习算法得出分类。 7.1 引例 7.1 引例 分类问题使用的数据集格式 描述属性可以是连续型属性,也可以是离散型属性;而类别属性必须是离散型属性。 连续型属性是指在某一个区间或者无穷区间内该属性的取值是连续的 ,例如属性“Age” 离散型属性是指该属性的取值是不连续的 ,例如属性“Salary”和“Class” 7.1 引例 分类问题使用的数据集格式 分类问题中使用的数据集可以表示为X={(xi,yi)|i=1,2,…,total} xi=(xi1,xi2,…,xid) ,其中xi1,xi2,…,xid分别对应d个描述属性A1,A2,…,Ad的具体取值 yi表示数据样本xi的类标号,假设给定数据集包含m个类别,则yi∈{c1,c2,…,cm},其中c1,c2,…,cm是类别属性C的具体取值 未知类标号的数据样本x用d维特征向量x=(x1,x2,…,xd)来表示 7.2 分类问题概述 7.2.1 分类的过程 7.2.2 分类的评价准则 7.2.1 分类的过程 7.2.1 分类的过程 获取数据 输入数据、对数据进行量化 预处理 去除噪声数据、对空缺值进行处理 数据集成或者变换 分类器设计 划分数据集、分类
您可能关注的文档
最近下载
- 中考数学复习 考前突破06二次函数与几何综合题(4大必考题型)原卷版.pdf VIP
- 供电局安健环技术标准.doc VIP
- (二模)郑州市2026年高三高中毕业年高三级第二次质量预测化学试卷(含答案).pdf
- 五年级上学期家长会.ppt VIP
- 《中国痴呆与认知障碍诊治指南(2025年版)》.docx VIP
- 方菱数控切割控制系统操作手册(Ver5.0).pdf
- 汽车电动助力转向系统设计.docx
- 2026年河南工业职业技术学院单招职业适应性测试题库与答案详解.docx VIP
- 好莱坞电影剧本_沃依采克_影视剧本写作.doc VIP
- (二模)郑州市2026年高三高中毕业年高三级第二次质量预测英语试卷(含答案)+听力音频.docx
原创力文档

文档评论(0)