C4.5决策树法在高校奖学金评定中应用.pdfVIP

C4.5决策树法在高校奖学金评定中应用.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第24卷 第2期 河南工程学院学报 (自然科学版) 2012年6月 JOURNALOFHENANIN旦! 垦 垦垦 Vo1.24.No.2 Jun.2012 G4.5决策树法在高校奖学金评定中的应用 马 杰 (郑州航空工业管理学院计算机科学与应用系,河南 郑州450015) 摘 要:奖学金是提高高校学生学习积极性的一种手段 ,采用先进的人工智能技术对学生的成绩进行智能评价和预测. 已成为一个新兴的交叉研究领域.采用C4.5决策树算法构建奖学金评定系统,挖掘学生成绩和奖学金等级关系的历史数据 . 建立学习成绩一奖学金等级智能评价模型.实验仿真发现,C4.5决策树算法的分类预测效果较为理想. 关键词:C4.5算法;决策树;高校奖学金评定 中图分类号:TP301 文献标志码:A 文章编号 :1674—330X(2012)02—0057—04 高校奖学金评定是一项每年必须重复的繁琐而又重要的工作,涉及范围很广,它要根据不同情况评定出 不同的奖学金获得者,需要记录和处理的数据量也很庞大.如何对奖学金获得者做出科学、有效的评价已成 为高校学生管理者关注的焦点问题之一…. 决策树是判断给定样本与某种属性相关联的决策过程的一种表示方法,该方法广泛应用于数据挖掘和 机器学习等领域,用来解决与分类相关的问题 ,是应用最广泛的逻辑方法.目前,生成决策树方法的算法 主要有3种:CART算法、ID3算法和c4.5算法,其中c4.5算法具有分类速度快且精度高的特点,是发展得 比较完善的一种决策树算法 . 1 CA.5决策树算法 c4.5算法是构造决策树分类器的一种有效算法,最终可以形成产生式规则.c4.5算法的输入是一张关 系表,由若干不同的属性及若干数据元组 (称为训练样本)组成.属性分为两部分,一部分作为判定对象属性 (判定树中的非叶节点),另一部分作为分类对象属性(判定树中的叶节点).c4.5算法采用信息熵的方法, 比较各个判定对象属性的信息增益率的大小,选择信息增益率最大的属性进行分类,递归生成一个判定 树 一 . 设 l5l为训练集 .s的样本总数,一共有m类样本 c(i=1,2,3,…,m),I l为类 c中的样本数,设 P =lcI/ISI是任意样本属于C的概率,训练样本分类属性的总信息熵E(s,.s,…,S)的计算公式为: m E(S1,Sz,…,Ls)=一∑(P log2(P)). (1) l I 设属性A具有 个不同值 {。。,a,…,a},可以用属性A将5划分为 个子集 {S,S,…,.s},其中5包含 s中这样一些样本,它们在A上具有值ai(j=1,2,…,).设ljs 为s类中c的样本数,以屙I生A为分类所 需的期望熵E(A)的计算公式为: E()=∑(IslI+I2』l+…+I 1)%E(SlJ,S2』,…,.s面)/l1. (2) J=1 属性A相对于类别集合c的信息增益Gain(C,A)的计算公式为: 收稿 日期 :2012—04—09 基金项 目:郑州航空工业管理学院青年基金项 目(2010103003) 作者简介:马伟杰(1982一),男,河南郑州人,硕士研究生,主要从事网络环境下的数据挖掘技术研究 · 58 · 河南工程学院学报 (自然科学版) Gain(C,A)=E(S,S:,…,S)一E(A). (3) 属性A相对于类别集合C的信息增益率 GainRatio(C,A)的计算公式为: GainRatio(C,A)=Gain(C,

文档评论(0)

xuefei111 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档