《数据仓库与数据挖掘技术》数据分类.ppt

举个例子,你和朋友在路上走着,迎面走来一个人,你对朋友说:我猜这个人是个上海人,那么这个问题就属于分类问题;如果你对朋友说:我猜这个人的年龄在30岁左右,那么这个问题就属于后面要说到的预测问题 * DMKD SIDES BY MAO DATA MINING: CONCEPTS AND TECHNIQUES DMKD SIDES BY MAO DMKD SIDES BY MAO DMKD SIDES BY MAO DMKD SIDES BY MAO DMKD SIDES BY MAO 《数据仓库与数据挖掘技术》 提纲 1 数据分类的基本概念 2 数据分类的评价准则 3 数据分类算法 4 KNN算法 数据分类的基本概念 分类(classification):是一个从现有带有类别的数据集中寻找同一类别数据的共同特征,并以这些特征为依据对新数据进行区分的过程。 分类问题属于预测性的问题,但是它跟普通预测问题的区别在于其预测的结果是类别(如A、B、C三类)而不是一个连续的数值(如55、65、75……)。 * DMKD SIDES BY MAO * 商业案例中,分类问题可谓是最多的: 给你一个客户的相关信息,预测一下 信用度是好/一般/差? 将来会成为你的高/中/低价值的客户? 是否会使用你的某个产品? * DMKD SIDES BY MAO * “二分”问题 有一种很特殊

文档评论(0)

1亿VIP精品文档

相关文档