基于类标签变化的改进SLIQ算法研究.pdfVIP

  • 10
  • 0
  • 约2.34万字
  • 约 5页
  • 2016-02-02 发布于天津
  • 举报
基于类标签变化的改进SLIQ算法研究.pdf

MicrocomputerApplicationsVo1.31,No.10,2015 基金项 目 微型电脑应用2015年第3l卷第 10期 文章编号:1007—757X(2015)10—0027-05 基于类标签变化的改进 SLIQ算法研究 朱王晓嘉,余建坤 摘要:针对数据挖掘的决策树分类技术中,SLIQ分类器在建树阶段寻找最佳分裂属性时,需要计算大量数值型属性间中 间值 的基尼系数 ,算法时间效率低的问题 ,提 出一种改进的SLIQ算法。该算法通过判断数值型属性的预排序属性表 中的 类标签变化来选择合适分裂位置,减少可能存在的最佳分裂点。实验部分中,用UCI机器学习库中的数据集作分类测试。 与原来的SLIQ算法相 比,在没有降低分类准确率与扩大决策树规模的情况下,需要计算基尼系数的分裂点个数平均减少 了36.32%。最后,将改进算法应用于电子商务的客户分析,分类结果有助于商家作出正确决策。 关键词 :数据挖掘 ;决策树 ;分类;SLIQ算法;分裂点 中图分类号:TP301.6 文献标志码:A 0 引言 可以减少基尼系数的计算次数,但是属性值的分割算法仍然

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档