数据挖掘述(1.ppt

数据挖掘述(1

敬请各位同学提出宝贵意见 非常感谢 值 类 220 125 120 100 95 90 85 75 70 60 N N N N Y Y Y N N N 172 122 110 97 92 87 80 72 65 候选划分点 对于候选点72,划分后类别统计如下 3 5 =70(T2) 0 2 70(T1) 类=Y 类=N 值 类 220 125 120 100 95 90 85 75 70 60 N N N N Y Y Y N N N 172 122 110 97 92 87 80 72 65 候选划分点 对于候选点80, 对于候选点87, 对于候选点92, 对于候选点97, 对于候选点110, 对于候选点122, 对于候选点172, 最佳候选点 根据上面的分析,可把“年收入”属性划分成两个区间(0,97)和[97,10000)分别设为属性A1和A2,则原数据集变为: 是 90K (A1) 单身 否 10 否 75K (A1) 已婚 否 9 是 85K (A1) 单身 否 8 否 220K (A2) 离异 是 7 否 60K (A1) 已婚 否 6 是 95K (A1) 离异 否 5 否 120K (A2) 已婚 是 4 否 70K (A1) 单身 否 3 否 100K (A2) 已婚 否 2 否 125K(A2) 单身 是 1 拖欠贷款 年收入 婚姻状况 有房 顾客Id 再按前面的

文档评论(0)

1亿VIP精品文档

相关文档