- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于支持向量机大学生学业动态预警研究
基于支持向量机大学生学业动态预警研究
摘 要:传统的大学生学业预警策略依赖大量人力,效率低且成效不足。为此引入数据挖掘技术自动预测将来学习成绩并及时发出预警信息。首先从现有业务级信息系统中抽取并构造学业状态特征向量;然后运用支持向量机进行统计学习得到非线性预测模型;最后利用模型自动发现学习状态不佳的学生并发出预警。经测试本方法的准确率达84%,可有效提高学业监督效率,并可推广应用于学生党建信息挖掘、学习目标预测等其它个性化管理领域。
关键词:支持向量机;学业预警;数据挖掘;大数据
中图分类号:G642 文献标志码:A 文章编号:1673-8454(2017)17-0065-03
一、引言
大学生相比中小学生具有以下特点:①学习生活更加自由,没有强制晚自习、没有频繁的考试测验、没有父母的督促,各种欲望更加强烈,精力更易分散;②价值观易发生改变,学习主动性、积极性容易动摇,甚至产生“读书无用”、“混学位”的观念,极大降低了学习热情。因此,大学生的学业状态波动较大。有很多高考成绩非常优秀的学生,因过渡沉溺于游戏、谈恋爱、兼职等活动,补考、挂科连连甚至退学。纵观学业下滑的学生,多数在早期没有及时发现、及时劝导,以致积重难返。显然,早期及时发现问题是关键,但这需要辅导员、班主任及任课教师付出极大的努力,工作量巨大。因此,借助新的信息技术(如大数据、数据挖掘技术)成为学业自动监督的关键途径,对于提升学生的学习成绩、提高学校的教学和管理水平都具有深远的意义。[1]
当前,全国高校普遍实施了数字化校园建设。其中,学生管理系统实现了信息管理、信息发布、互动交流、网上办事、在线教学等主要功能。这些功能模块基本都停留在业务操作级,不外乎增、删、改底层数据,计算机只不过是一个复合的操作工具,替代了落后的纸质管理模式,而隐藏在这些底层数据中的知识、规律长期得不到发掘。例如,学生出入图书馆、借阅书刊需要刷卡,那么通过分析学生在图书馆的刷卡数据不难发现其学习的主动性、学习的兴趣点等有用信息,利用这些由底层数据挖掘得到的信息可帮助教师、辅导员或其它管理者更有针对性地为学生服务。[2][3]
目前国内外已开展了许多学业状态预测研究。主要运用关联规则、聚类、决策树、统计学习等方法,分析先前课程成绩对后续课程的影响,预测后续课程的成绩。[4-7]也有研究根据家庭情况、生活习性等外围因素推断是否预警。[8-10]但综合学习和生活特征进行学业预警的研究,目前未见述及。因此,本研究的特色在于综合学生当前的学习生活状态以及过往的学习成绩预测将来一段时间(如期末考试时)的学业表现。
二、基于支持向量机的学业预警方法
Vapnik 提出支持向量机[11][12](Support Vector Machine, SVM)是有监督的统计学习方法,可构建特征组与类别之间的非线性关联。基于SVM的学业预警方法如下:
第一步,构造学业状态特征向量,如表1所示,由考勤指数、“宅”指数、学习指数、成绩指数以及家境这五个可能影响学业的关键指标构成,并将预测结果划分为“好、中、差”三级,如表2所示,进而根据预测结果给予相应处理。表1给出了各指标的依据、量化方法和数据来源。注意,任何一个指标都无法完全刻画学业状态,只是可能的影响因素。
第二步,从学校的相关业务级信息系统(如教务、学生信息管理系统)抽取基础数据并按照表1和表2的量化方法构造学业状态样本集(由学业状态特征向量和人工标定的状态类别构成)。所构造的样本集分为两组,一组用于训练SVM分类器,另一组用于测试方法的正确率、验证方法的有效性。
第三步,选择RBF型核函数,采用交叉验证选择最优参数――惩罚因子C及核函数参数γ。(具体详见实验部分)然后采用“一对一”方法从训练集统计学习得到3个SVM分类器。
第四步,运用得到的3个SVM分类器对测试样本分别进行测试,并累计各类别的得分,选择得分最高者所对应的类别作为测试样本的预测结果。若预测结果与人工标定的类别一致,表明预测正确,反之错误,如此可知分类器测试的总体正确率。当正确率达到阈值,即可对任意学生的学业状态进行预测;反之重新构造样本集,调整参数再次学习。
在本研究中,考试成绩为五级记分制:原始成绩85-100分记为5点(优秀);75-85(不含)分记为4点(良好);65-75(不含)分记为3点(中等);60-65(不含)分记为2点(及格);不及格记为0点。平均绩点可反映学生当前成绩状态。
三、实验与分析
1.实验方法及结果
在实验中我们采用的SVM软件包为LIBSVM。LIBSVM 是台湾大学林智仁博士等开发设计的一个操作简单、易于使用、快速有效的通用SVM 软件包,也是目前最流行的SVM软
您可能关注的文档
- 基于捷联惯性导航室内定位系统设计研究.doc
- 基于授课效果知识积累探究.doc
- 基于掌上电脑数据采集系统开发.doc
- 基于掌握学习教学理论下初三数学复习课教学研究.doc
- 基于掌握学习法护理技术微课建设研究.doc
- 基于排列熵 CHMM齿轮故障诊断.doc
- 基于排名因子分析我国大学发展策略研究.doc
- 基于排水固结法在软土路基施工中研究.doc
- 基于排斥理论边疆地区金融包容发展创新研究.doc
- 基于排放权核算雾霾治理创新.doc
- 2026年中国电建集团海南电力设计研究院有限公司招聘备考题库完整答案详解.docx
- 2026年中稀(深圳)研究院有限公司招聘备考题库及完整答案详解1套.docx
- 2026年关于广东龙门产业投资集团有限公司公开招聘三名职工的备考题库含答案详解.docx
- 2026年中广核环保产业有限公司招聘备考题库及参考答案详解.docx
- 2026年中国科学院深海科学与工程研究所招聘备考题库含答案详解.docx
- 2026年中铝材料应用研究院有限公司招聘备考题库有答案详解.docx
- 2026年中色创新研究院(天津)有限公司招聘备考题库附答案详解.docx
- 2026年五指山市农业投资发展集团有限公司招聘备考题库含答案详解.docx
- 2026年中国能源建设集团有限公司工程研究院招聘备考题库及完整答案详解一套.docx
- 2026年兰州海关技术中心酒泉实验室招聘非在编工作人员备考题库参考答案详解.docx
原创力文档


文档评论(0)