第5章数据分类范例.ppt

* * * * * * * * * * * * * * * * * * * * * * * * * * * * 连续型描述属性的处理方法举例 假设年龄序列为 {32,25,46,56,60,52,42,36,23,51,38,43,41,65} 寻找最佳的分割点 * 数据仓库与数据挖掘 * * 数据仓库与数据挖掘 * 5.3.5 SQL Server 2005中的决策树应用 创建 Analysis Services 项目 创建数据源 创建数据源视图 创建决策树挖掘结构 设置决策树挖掘结构的相关参数 建立决策树挖掘模型 查看挖掘结果 * 数据仓库与数据挖掘 * 5.3.6 决策树剪枝 决策树剪枝过程试图检测和去掉多余的分枝,以提高对未知类标号的数据进行分类时的准确性 先剪枝方法:在生成决策树的过程中对树进行剪枝 后剪枝方法:在生成决策树之后对树进行剪枝 * 数据仓库与数据挖掘 * 5.4 支持向量机 支持向量机的特点 1995年由Vapnik等人提出 对小样本学习有好的泛化能力 最优分类超平面 * 数据仓库与数据挖掘 * 5.4 支持向量机 设线性可分的训练集为 Margin H2 H1 H w * 数据仓库与数据挖掘 * 5.4 支持向量机 线性判别函数 分类超平面 样本要满足 满足 的数据样本离超平面H是最近的 * 数据仓库与

文档评论(0)

1亿VIP精品文档

相关文档