第4章第三部分之一.ppt

第三部分:数据挖掘 概念 决策树 神经网络 Na?ve Bayes 基本概念 分类:给定一个数据库D={t1,t2,….,tn}和一组类C={c1,c2,….,cm}, 分类问题是去确定一个映射f:D C, 每个元组ti被分配到一个类中。 分类技术之一:决策树 决策树的应用 假如负责借贷的银行官员利用决策树来决定支持哪些贷款和拒绝哪些贷款,那么他就可以用贷款申请表来运行这棵决策树,用决策树来判断风险的大小。“年收入¥40,00”和“高负债”的用户被认为是“高风险”,同时“收入 ¥40,000”但“工作时间5年”的申请,则被认为“低风险”而建议贷款给他/她。 商场中判断顾客的等级 电子商务活动中判断客户的类型 网上书店分析客户流失情况,决策树技术中的是解决这一问题的有效途径。 决策树 决策树一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。 选择分割的方法有好几种,但是目的都是一致的:对目标类尝试进行最佳的分割。 从根到叶子节点都有一条路径,这条路径就是一条“规则”。 使用决策树进行分类 决策树 一个树形的结构 内部节点上选用一个属性进行分割 每个分叉代表一个测试输出 叶子节点表示一个类 决策树生成算法分成两个步骤 树的生成 开始,数据都在根节点 递归

文档评论(0)

1亿VIP精品文档

相关文档