- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
随机森林算法在中医药院校贫困生认定预测中应用研究
随机森林算法在中医药院校贫困生认定预测中应用研究
[摘要] 中医院校的贫困生认定工作是非常重要的,但是目前的认定方法还存在着不科学不公正等问题。为完善贫困生的认定工作,本文基于随机森林分类算法,对贫困生的认定进行研究。在相同的数据集中,分别使用决策树算法和随机森林算法对贫困生进行分类,决策树算法的平均正确率为74.43%,而随机森林算法模型的平均正确率为85%,并进一步对两种算法进行比较。实验证明,随机森林算法分类正确率较高,适合贫困生的认定工作。随机森林为贫困生的认定提供了一种新方法。
[关键词] 贫困生认定;随机森林;决策树;机器学习
[中图分类号] R-3 [文献标识码] A [文章编号] 1673-7210(2017)05(b)-0164-05
[Abstract] It is an important task to identify the poor students in traditional Chinese medicine colleges and universities, and there are uneconomical and unjust problems in the current methods. In order to improve the identification of poor students, this paper based on the random forest classification algorithm to study the identification of poor students. In the same data set, the decision tree algorithm and the random forest algorithm are used to classify the poor students. The correct rate of decision tree algorithm is 74.43%, while the accuracy rate of the random forest algorithm model is 85%, and further comparison of the two algorithms. Experiments show that the classification accuracy of random forest algorithm is high, which is suitable for the identification of poor students. Random forest provides a new way for the identification of poor students.
[Key words] Poor students identification; Random forest; Decision tree; Machine learning
近年来,随着中医药类高校不断扩大招生人数,在读贫困生人数也明显增加。所谓贫困生是指家庭收入低,完成学业有经济困难的学生。数据显示,2015年,全国高校在校家庭经济困难学生比例超过40%,政府、高校及社会等各类政策措施共资助高校学生4141.58万人次,资助总金额847.97亿元[1]。可以看出,贫困生所占比例较大。但高校中也不乏出现为领取助学金而谎报为贫困生的情况。因此,如何精准地认定在校贫困生,更好的通过助学金帮助他们完成学业是一项非常重要而又意义深远的工作。目前,贫困生的认定工作人为因素较多,缺乏科学性和合理性,如何科学、公正、合理、高效的认定贫困生是亟待解决的问题。
1 高校贫困生认定研究
当前,很多高校的贫困生认定主要方式为:学生主动填写《普通本科高校国家助学金申请表》《普通本科高校国家励志奖学金申请表》等各类助学金申请表,各个班根据申请同学家庭情况、日常消费等情况做出初步评定。班级上报院系后,院系根据学校给定名额进一步评定,最后确定最终贫困生人选。这种认定方法掺杂人为因素,在贫困生的评选过程中很难做到公平公正、科学合理。
也有高校根据一卡通消费数据情况给出贫困生认定的一些限制条件[2],例如通过学生就餐、日常刷卡消费情况,给定学生最低生活保障线,由此确定贫困生。这种做法主要根据数据统计分析得出,有一定的科学性,但是认定指标过于单一,认定指标不够全面,存在片面性。
在贫困生认定问题上,很多学者应用数据挖掘和机器学习算法进行了一些有益的尝试。曹路舟[3]提出使用FP-growth算法找出贫困生数据之间的关联规则,为认定贫困生提
文档评论(0)