- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《C4.5决策树法在高校奖学金评定中的应用》.pdf
第24卷 第2期 河南工程学院学报 (自然科学版)
2012年6月 JOURNALOFHENANIN旦! 垦 垦垦 Vo1.24.No.2
Jun.2012
G4.5决策树法在高校奖学金评定中的应用
马 杰
(郑州航空工业管理学院计算机科学与应用系,河南 郑州450015)
摘 要:奖学金是提高高校学生学习积极性的一种手段 ,采用先进的人工智能技术对学生的成绩进行智能评价和预测.
已成为一个新兴的交叉研究领域.采用C4.5决策树算法构建奖学金评定系统,挖掘学生成绩和奖学金等级关系的历史数据 .
建立学习成绩一奖学金等级智能评价模型.实验仿真发现,C4.5决策树算法的分类预测效果较为理想.
关键词:C4.5算法;决策树;高校奖学金评定
中图分类号:TP301 文献标志码:A 文章编号 :1674—330X(2012)02—0057—04
高校奖学金评定是一项每年必须重复的繁琐而又重要的工作,涉及范围很广,它要根据不同情况评定出
不同的奖学金获得者,需要记录和处理的数据量也很庞大.如何对奖学金获得者做出科学、有效的评价已成
为高校学生管理者关注的焦点问题之一….
决策树是判断给定样本与某种属性相关联的决策过程的一种表示方法,该方法广泛应用于数据挖掘和
机器学习等领域,用来解决与分类相关的问题 ,是应用最广泛的逻辑方法.目前,生成决策树方法的算法
主要有3种:CART算法、ID3算法和c4.5算法,其中c4.5算法具有分类速度快且精度高的特点,是发展得
比较完善的一种决策树算法 .
1 CA.5决策树算法
c4.5算法是构造决策树分类器的一种有效算法,最终可以形成产生式规则.c4.5算法的输入是一张关
系表,由若干不同的属性及若干数据元组 (称为训练样本)组成.属性分为两部分,一部分作为判定对象属性
(判定树中的非叶节点),另一部分作为分类对象属性(判定树中的叶节点).c4.5算法采用信息熵的方法,
比较各个判定对象属性的信息增益率的大小,选择信息增益率最大的属性进行分类,递归生成一个判定
树 一 .
设 l5l为训练集 .s的样本总数,一共有m类样本 c(i=1,2,3,…,m),I l为类 c中的样本数,设
P =lcI/ISI是任意样本属于C的概率,训练样本分类属性的总信息熵E(s,.s,…,S)的计算公式为:
m
E(S1,Sz,…,Ls)=一∑(P log2(P)). (1)
l I
设属性A具有 个不同值 {。。,a,…,a},可以用属性A将5划分为 个子集 {S,S,…,.s},其中5包含
s中这样一些样本,它们在A上具有值ai(j=1,2,…,).设ljs 为s类中c的样本数,以屙I生A为分类所
需的期望熵E(A)的计算公式为:
E()=∑(IslI+I2』l+…+I 1)%E(SlJ,S2』,…,.s面)/l1. (2)
J=1
属性A相对于类别集合c的信息增益Gain(C,A)的计算公式为:
收稿 日期 :2012—04—09
基金项 目:郑州航空工业管理学院青年基金项 目(2010103003)
作者简介:马伟杰(1982一),男,河南郑州人,硕士研究生,主要从事网络环境下的数据挖掘技术研究
· 58 · 河南工程学院学报 (自然科学版)
Gain(C,A)=E(S,S:,…,S)一E(A). (3)
属性A相对于类别集合C的信息增益率 GainRatio(C,A)的计算公式为:
GainRatio(C,A)=Gain(C
您可能关注的文档
- 《5,10-亚甲基四氢叶酸还原酶基因多态性与妊娠期高血压疾病的相关性研究》.pdf
- 《5~10周龄扬州鹅日粮中适宜蛋氨酸水平的研究》.pdf
- 《5~22 GHz平坦高增益单片低噪声放大器》.pdf
- 《5~6岁儿童绘画创作中艺术思维的过程与特点》.pdf
- 《5~6岁幼儿社交焦虑、孤独感与父母的子女教育心理控制源的关系研究》.pdf
- 《5~7周龄SD和Wistar大鼠主要脏器系数及体尺的测定》.pdf
- 《5~7岁幼儿告状行为动机分析》.pdf
- 《5~7岁幼儿告状行为策略分析》.pdf
- 《5~7岁幼儿谦让行为的类型、特征及由此引发的思考》.pdf
- 《5~8周龄肉鹅能量和蛋白质营养需要量研究》.pdf
- 《C4.5算法的分析及应用》.pdf
- 《C4.5算法的改进及其在学生成绩分析中的应用》.pdf
- 《C4~5脱位或骨折不同内固定方式的生物力学测试及光弹性研究》.pdf
- 《C5-6、T12-L1、L4-5椎间盘与相邻椎体的压缩力学特性》.pdf
- 《C5V作为首选化疗方案治疗肝母细胞瘤效果观察》.pdf
- 《C8H3O6NNa2·H2O脱水过程的热分析动力学》.pdf
- 《C8H4O5Na2·H2O脱水过程的热分析动力学研究》.pdf
- 《Ca(Sm0.5Nb0.5)O3介质陶瓷的微波烧结》.pdf
- 《Ca8 MgY(PO4)7∶Re3+(Re3+=Eu3+,Ce3+,Tb3+)发光材料的合成及发光性能研究》.pdf
- 《CaCl2作为异硫氰酸曙红固体基质室温磷光增强剂及其在免疫分析中的应用》.pdf
文档评论(0)