数据仓库与数据挖掘 数据仓库与数据挖掘 第5章 数据分类 5.1 引例 一、分类的定义 把数据样本映射到一个事先定义的类中的学习过程,即给定一组输入的属性向量及其对应的类,用基于归纳的学习算法得出分类。 例如:(1)正常信用卡与欺诈信用卡的分类 (2) 正常细胞与癌变细胞的分类 (3)正常邮件与垃圾邮件的分类 5.1 引例 5.1 引例 二、分类问题使用的数据集(续) 5.1 引例 二、分类问题使用的数据集(续) 分类问题中使用的数据集X={(xi,yi)|i=1,2,…,total} xi=(xi1,xi2,…,xid) ,其中xi1,xi2,…,xid分别对应d个描述属性A1,A2,…,Ad的具体取值 yi表示数据样本xi的类标号,假设给定数据集包含m个类别,则yi∈{c1,c2,…,cm},其中c1,c2,…,cm是类别属性C的具体取值 未知类标号的数据样本x用d维特征向量x=(x1,x2,…,xd)来表示 5.2 分类问题概述 一、 分类的过程 二、 分类的评价准则 一、 分类的过程 一、分类的过程(续) 获取数据 输入数据、对数据进行量化 预处理 ※ 去除噪声数据、对空缺值进行处理 ※ 数据集成或者变换 分类器设计 划分数据集、分类器构造、分类器测试 分类决策 对未知
您可能关注的文档
- 补充二、希尔伯特变换及其应用开题报告.ppt
- 补充反胶束开题报告.ppt
- 第七章交通安全简析.ppt
- 第七章假设检验_社会统计学简析.ppt
- 第七章加工食品的安全性简析.ppt
- 第四章03肿瘤三重点分析.ppt
- 捕捉精彩瞬间初中美术开题报告.ppt
- 第四章3AD转换器的原理与应用重点分析.ppt
- 第5章-曲线运动-物理-新课标(RJ)-必修2范例.ppt
- 第七章几何光学基础简析.ppt
- 2025年下半年小学教师资格考试简答题汇总.pdf
- 护理教学比赛资源整合.pptx
- 2022泰和安消防 JTGB-HM-TX3H01 JTGB-HM-TX3H02 TGB-HM-TX3H03 系列点型红外火焰探测器.docx
- 2025年驾驶证资格考试最新最全交通标志大全.pdf
- 护理教学理念:更新与发展.pptx
- 2025年新驾考科目一巧记速记口诀(全国通用).pdf
- 2025年一级建造师《项目管理》黄金预测考点【打印版】.pdf
- 证券公司高级管理人员资质测试章节练习-第一部分综合类第六章至七章:证券投资基金法、信托法.pdf
- 护理教学研究:方法与成果.pptx
- 麻纺车间设备更新准则.docx
原创力文档

文档评论(0)