用K均值法对自考考生流失的研究.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用K均值法对自考考生流失的研究.pdf

EraNo.52008 ·48· Computer 用K均值法对自考考生流失的研究 毕胜1’2 (1.北京工业大学软件学院,北京100083;2.北京教育考试院自学考试办公室) 摘要:高等教育自学考试(自考)是我国高等教育的一种重要形式。考生流失是自考的一种普遍现象。流失原因分析对 自考管理方法的改革有着重要的意义。文章尝试采用聚类分析中K.Means方法对北京市自考考生流失的多重因素进行 分析,揭示出自考考生流失的一些规律。 关键词:数据挖掘;K-均值;高等教育自学考试;考生流失;聚类 0引言 参加考试。因此研究自学考试考生流失就必须对流失考生加 以明确定义。 数据挖掘(DataMining)指的是从大量的、不完全的、有噪 首先定义两个概念:“跨度”和“暂停期”。“跨度”定义为考 声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不 知道的、但又是潜在有用的信息和知识的过程。数据挖掘与知 生参加第一门课程考试与参加最后一门课程考试的时问间隔 (单位为月);“暂停期”定义为考生两门课程考试间隔的最大时 识发现技术是计算机领域一个非常有活力的研究课题,其研究 问(单位为月)。 成果已广泛应用于金融、医疗保健、零售、制造业、工程与科学 图1、图2分别是北京市12658名自考已毕业的考生“跨度” 等行业。考生流失是自考的一种普遍现象,分析流失原因对自 考管理方法的改革有着重要意义。一些研究人员采用分类统汁 和“暂停期”的统计数据,其中专科8859人,他们中99.5%以上的 刚等研究方法,从公共课成绩入手分析流失的规律,对该问题 毕业生跨度为6lj个月,94.1%以上的毕业生的暂停期为24个 进行了基础性的研究。本文采用数据挖掘中的聚类分析方法寻 月;本科3799人,他们中99.3%以上的毕业生跨度为66个月, 找高等教育自学考试考生各种属性和考生流失之间的联系,希 95.o%以上的毕业生的暂停期为24个月。因此在研究中定义66 望能为相关机构提供浓缩的数据归纳结果和有效的建议,更好 个月和24个月作为“跨度”和“暂停期”的流失阈值A和B。 地服务于教育机构,服务于考生。 自考考生流失的定义:跨度大于等于A(66个月)且最后一 门课程考试距当前最近一次考试时间大于等于B(24个月)的 1流失定义与流失考生数据提取 考生即为流失考生。 自学考试的考试时间完全可以由考生自己选择,学制没 根据上述定义,从还未毕业的18050名考生中筛选出 有明确的期限,考生流失既不需要到相关部门认定,也不保证 12545名流失考生。总流失率为69.5%。其中专科流失率为 以后不会再来参加考试。也就是说不再参加考试的考生在学 72%,本科流失率为54.3%。(注:其中专本同时报考的考生人数 籍中不会有记载,而且过了很长时间(2、3年)后也许会重新 为1275人。) 到现场听课的农民,可通过互联网收看授课的现场画面。三是 书情报学刊,2006.2:5—7 利用网络课件。针对全市的食用菌、绿色蔬菜、笋竹林等支柱产 12】高广生.构建宽各农业信息服务体系∽前沿,2006.6:204~206 业制作了农村实用技术电视专题

您可能关注的文档

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档