基于决策树技术对学生未报到原因的分析.pdfVIP

基于决策树技术对学生未报到原因的分析.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于决策树技术对学生未报到原因的分析

第1期 福建教育学院学报 NO.1 2015年1月 JOURNAL OF FUJIAN INSTITUTE OF EDUCATION Jan,2015 基于决策树技术对学生未报到原因的分析 1 傅振南 (福建教育学院,福建 福州 350025) 摘 要:利用决策树技术对作者所在高校录取的学生数据进行挖掘,获得学生录取但没来报到的主要影 响因素,指导今后更好地制定招生计划,针对性地开展招生宣传,有效的利用学校资源,同时针对原因采取 相应的措施提高学生的报到率。 关键词:决策树;ID3;招生;报到率 中图分类号:TP31 文献标识码:A 文章编号:1673-9884(2015)01-0124-04 近年来随着我国高等教育改革的不断深化,高校 一、决策树数据挖掘过程 招生规模不断的扩大,招生政策也发生了很大的变化, 图 1 显示了决策树数据挖掘的完整过程。研究表 特别是政策取消了对已录考生不报到但不要求其承 明在整个数据挖掘项目中,数据预处理步骤约占整个 担任何责任且可参加下次高考基本不作任何限制,随 项目时间预算的 60%到 80%,因为现实世界中数据大 之而来的问题是已录取新生报到率显著降低,特别是 体上都是不完整,不一致的脏数据,无法直接进行数 对于高职高专院校。这不仅会浪费国家教育资源且浪 据挖掘,或挖掘结果差强人意,在预处理阶段,必须 费学校的招生计划,增加学校招生成本甚至严重影响 根据分析的实际情况选择高质量的数据才能够进行 学校正常教学秩序。有效分析学生未报到原因并采取 有效的数据挖掘,以便得到有用的信息。此过程采用 针对性措施,提高新生的报到率已成为高职高专院校 数据挖掘中的 ID3 决策树算法对录取学生的未报到 迫切需要研究和解决的问题,下面利用决策树工具对 原因进行建模,以找出学生被录取但未报到的原因, 学生未报到原因进行分析。 以采取相应的措施降低未报到率,提高学校的办学竞 决策树和决策规则是解决实际应用中分类问题 争力。 的成熟数据挖掘方法。决策树工具能够创建一个模型 二、ETL(Extract-Transform-Load)过程 用于预测一个离散的字段(类),可以用一个树型结构 (一)选择相关的字段 描述产生的模型,同时可以从模型中提取重要的规则, 根据决策树分析的需求,从作者所在高校的近年 分析对分析领域产生影响的重要原因。 普通高职录取数据库中抽取相关的数据,包括录取考 生的投档单表、专业计划代码表、名称表等。另外整 数据源 抽取 清洗转 数据选择 换 转载 ETL过程 有标签 理了作者所在高校自己的招生统计数据(以学生为实 数据集 验单元的数据集)。从录取学生的数据集中抽取一下 入 输 字段的数据:考生类别名称、地区名称、考生奖励或

您可能关注的文档

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档