數据挖掘在教师调串课中的应用研究.docVIP

數据挖掘在教师调串课中的应用研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
數据挖掘在教师调串课中的应用研究

数据挖掘在调串课中的应用研究 摘要:针对我校近三年来的调串课情况,应用数据挖掘技术,对海量的教师调串课数据进行分析整理,得出了教师调串课的一般规律,将规律应用在课程编排过程中,解决了资源浪费等问题,取得了良好的效果。 关键词:调串课、数据挖掘、决策树、增益率。 The application of data mining for transfer lessons Zhanglei (The academic administration of Jiamusi University HeiLongjiang province) Abstract: In connection with the situation of transfer lessons for nearly three years,use the data mining,analysis the mananimity data of teachers which transfer lessons,obtain the laws of teacher transfer lessons.use those laws in course arranging resolve the problems of resource waste and good effectiveness is gained. 引言 日常教学中经常会有教师因为各种各样的问题要求进行调串课,这样不仅打破了正常的教学规律,给日常的课程安排和教学检查带来麻烦,而且造成了很大的人力、教室资源等方面的浪费。如何在教师的基本数据中提取出有用的信息和知识,对潜在的调串课现象进行预处理,减少调串课对正常教学的影响,成为各高校教学管理中亟待解决的问题。但是由于各学校调串课的数据量巨大,仅以我校为例, 2009年9月就多达上百份,使用简单的统计学方法无法满足需求,因此,综合本校的具体情况,应用数据挖掘技术中的决策树算法,解决本校调串课所带来的不良影响。由于调串课是比较典型的分类问题,并且某些训练样本可能缺少属性,所以本文使用C4.5决策树模型。 一、数据清理 教师的调串课基本情况包括如:姓名、性别、年龄、学历等,具体数据情况见表1。(教师姓名为虚构,数据以2008年春季学期部分数据为例。) 编号 学院 姓名 性别 年龄 学历 职务 是否调串课 音乐学院 高亮 女 30 本科 调课 材料学院 繁荣 女 53 硕士 教研室主任 调课 人文学院 王民 女 45 本科 院长 调课 材料学院 杨斌 男 40 硕士 教研室主任 调课 教育科学学院 许美 女 40 硕士 院长 调课 外国语学院 孟秀 女 33 本科 未调课 药学院 于丽 女 45 硕士 副院长 调课 教育科学学院 闫华 男 29 本科 调课 理学院 咸淳 男 45 本科 副院长 未调课 材料学院 李博 男 28 本科 调课 基础医学院 刘波 男 50 本科 调课 信息学院 王梅 女 40 硕士 未调课 生命科学学院 董文 男 41 博士 教研室主任 调课 机械学院 杨华 女 26 本科 未调课 国际学院 王元 男 39 硕士 未调课 (表1) 由于表中样本存在缺少属性的现象,所以针对不同属性的缺失采用不同的方法进行预处理。如:缺失姓名的样本将直接抛弃,缺失年龄的采用箱平均值平滑法进行处理,缺失学历的直接填充为本科。将无课教师筛选出去计算中不作考虑。 二、计算增益率选取属性 在决策树建立过程的选择点上,增益率最大的属性是用来进一步细分树结构而选取的属性。属性的增益率计算公式[1]: GainRatio(A)=Gain(A)/Split Info(A) Gain的计算公式:Gain(A)=Info(I)-Info(I,A) 其中:Info(I)= - log() 将I划分为k个结果后 Info(I,A)= - Split Info(A)= - 将(表1)中的除编号外的各个属性分别代入到公式中,其中#inI取为在选定属性下是否调串课的数据总个数,#inclassi(#inclassj)所取的值为调课的数据个数。通过计算机自动计算出每个属性大的增益率。 三、构建决策树 计算取得增益率之后,根据所得的增益率最高选取该属性作为选定节点构建决策树。 构建决策树的算法为[2]: Decision_tree(samples,attr_candidate) 将属性设为决策树的点并计为C; if samples都在同一类then返回

文档评论(0)

sfkl + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档