面向不确定残缺数据大学生成绩预测方法.docVIP

下载本文档

3
0
约9.15千字
约 17页
2018-09-22 发布于福建
举报
版权申诉

面向不确定残缺数据大学生成绩预测方法.doc

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

面向不确定残缺数据大学生成绩预测方法

面向不确定残缺数据大学生成绩预测方法　　摘要：大学生在课程规划方面有很高的自由度，这使得成绩数据较不规整，研究者很难对学生的前序课程成绩进行有效分析、利用。已有的成绩预测方法普遍未考虑学生前序课程成绩残缺的现象，从而导致预测准确性不佳。提出一种基于K近邻局部最优重建的残缺数据插补方法，该方法能够有效抑制前序课程成绩缺失对预测模型精度的影响。实验表明，该方法的补全效果优于已有的均值插补、GMM插补等方法，结合随机森林模型实现了有效的成绩预测，为学生成绩管理、就业能力预警提供了客观的参考。　　关键词：成绩预测；缺失数据；数据插补；数据挖掘；机器学习；随机森林模型　　中图分类号： TN911?34； TP391 文献标识码： A 文章编号： 1004?373X（2018）06?0145?05 　　Abstract： College students have high freedom on their course planning， which makes the score data irregular and in disorder， and makes it difficult for researchers to effectively analyze and utilize students′ scores of foreword curriculums. The score missing phenomenon of students′ foreword curriculums is generally not considered in the existing score prediction methods， resulting in relatively low prediction accuracy. Therefore， a missing data imputation method based on local optimal reconstruction of k?nearest neighbors is proposed， which could effectively suppress the influence of foreword curriculum score missing on the accuracy of prediction model. The experimental results show that the completion effect of the proposed method outperforms that of the existing mean imputation method， GMM imputation method， and other methods. Effective score prediction is realized by combining with random forest model to provide an objective reference for students′ score management and early warning on students′ employability. 　　Keywords： score prediction； missing data； data imputation； data mining； machine learning； random forest model 　　0 引言　　高等教育问题是多年以来的社会热点，从“精英教育”到“大众教育”，高校扩大招生规模，面临着学生质量参差不齐，就业形势严峻等问题。如何准确评估大学生的学业完成质量，并进一步实现学业退步预警、就?I质量预测等应用，逐渐受到数据分析研究者的关注[1?4]。学生成绩不仅是评估高校教学质量的重要指标，还与学生管理及就业指导密切相关。有效预测学生成绩并及时进行干预，可以为学生学习思想动态的引导和就业能力的评估提供重要的依据。　　权小娟等基于985高校大学生的成绩数据，分析了大学生成绩的变化趋势及城乡差异[1]，分析结果具有一定的现实参考价值。但该文献属于描述性研究，仅分析了大学生群体成绩发展规律，但并未给出有效的成绩预测模型，故无法应用于大学生个体的成绩预测、预警。　　龙钧宇等人提出基于频繁模式发掘大学科目之间的强关联关系，并预测学生未来若干课程的成绩[2]。该方法有两方面的局限性：首先，强模式关联方法决定了一门课程的成绩仅由当前的少数几门成绩甚至一门成绩确定，限制了其预测准确率的提升空间；其次，该预测方法将成绩分为4个等级，无法对成绩进行精准、量化预