决策树在技工院校招生工作中研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
92  福  建  电脑  2013年第1期 决策树在技工院校招生工作中的研究 陈凡 (福建技师学院福建福州350001) 【摘  要】:数据挖掘作为一门综合性的新兴技术在各大领域得到了充分的使用和发展,本 文尝试将数据挖掘技术中的决策树方法应用于技工院校的招生中,挖掘出部分有价值的规则,希 望能对今后的招生工作提供有效的方法 【关键词】:技工院校,数据挖掘,ID3算法,研究 一、项目背景 近几年来.全国各地都出现了技工荒.劳动力 市场上供需缺口很大.专业技能人才严重供给不 足.与此同时全国的技工院校处于招不到学生的 尴尬地位.我省也是如此.我生目前共有91所技 工院校。4所技师学院.在校人数共有20万左右, 每年的就业率也高到96%.但是招生却每年呈递 减趋势.即使报名时候达到了招生人数,也经常频 频出现了溜生现象.报到率低下。这些现象出现的  后选择出最有效的分诶实例的属性。生成一些简 单易懂的明确规则,决策树算算法有很多种,比如 ID3/C4.5,C5.0、CART、CHAID,本文拟采用的引入 信息增益概念的ID3算法。 三、数据挖掘在招生工作中的实际应用 3.1算法的实际应用和说明 (一)算法的应用 f 1)声明类CFiledInf0,用来存放各个特征取 不同值的情况 原因一部分是由于高校的逐年扩张.人们受到传 typedef CAn.ay<HTREEITEM,HTREEITEM> 统的观念更愿意去报考高等院校.还有一大部分 原因是由于很多技工院校的招生没有目的性.常 常花很大力气宣传的地区并没有得到预期效果。 没有针对性的招生导致技工院校处于一个被动的 位置.由于没有准确的报到率.导致学校没有计划 性,比如宿舍数量、师资、教学设备等等、多了会造 成浪费.少了又会造成学生不满意导致最后溜生。 技工院校的招生形式、教育成本和其他的高 职院校有着很大的不同.招生数量严重影响着技 CAtt曲uteValueTree://每一’:特征值对应的treectrl 的item class CFiledInfo:public CObiect ( public: CFiledInfoO; CFiledInfo(int nAttribute); CFiledInfb fconst CFiledInfo&OtherFiled— Info); 工院校的正常运作。因此有效地提高报到率,有针 CString sFieldName;//特征名称 对性的进行招生.尽可能地扩大招生数目。成为当 int nFieldValueTvpeCount;//特征取不同值的 前各个技工院校的首大问题. 二、相关概念 2.1数据挖掘 个数 CStringArrav FieldValue“st;//特征取到的所有 不同值的列表 数据挖掘川(Data Mining)就是从大量的、不完 CAttributeValueTree m—AttributeValueTree; // 全的、有噪声的、模糊的、随机的实际应用数据中, 提取隐含在其中的、人们事先不知道的、但又是潜 在有用的信息和知识的过程。它是一个多阶段的 过程。 和上面字符串数组一一对应.存放每个特征值对 应的treectrl的item CDWordArmv FieldValueCount://和上面字符 串数组一一对应.存放特征取到的不同值的个数 2.2决策树 C DWordArrav PositiveClassCount://和上面字 决策树算法是数据挖掘中一种比较好的算 法.它可以选择树的每个节点作为测试的属性.然 万方数据 符串数组一一对应.存放特征取到不同值时该条 记录为P类f招生决策巾报到的考生为P类1的个 2013年第l期  福  建  电脑  93 数 CDWordArray NegativeClassCounf;//和上面字 符串数组一一对应.存放特征取到不同值时该条 记录为N类(招生决策中未报到的考生为N类)的 个数 】 (2)递归建树函数  然后逐条记录读取.每条记录中得到的特征 的信息后,如果特征取值在FieIdValueList中没有 则将该特征值append到FieldValueList;否则将 FieldValueCount值累加.将该条记录类别值累加 到PositiveClassCount或NegativeClassCount。 记录读取结束后.得到所有特征的信息.据此 计算信息熵、条件熵、互信息,然后建立顶层决策 树(直接建立到已经存在的CTreeClrl上) void CTreeViewDMfunction::RecursionTree 然后取得顶层决策树的各个属性值对应的数 (H

文档评论(0)

wpxuang12 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档