基于决策树技术的大学生体测成绩分析研究.docx

基于决策树技术的大学生体测成绩分析研究.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

基于决策树技术的大学生体测成绩分析研究

?

?

林艺俊沈良忠

摘要:近几年来,大学生的体测成绩一直呈现下降趋势,引起了关注。该文以我校学生体测成绩为数据样本,利用决策树ID3算法基于Weka平台进行处理后得到的影响大学生体测成绩的影响因素,提供大学生提高体测成绩的参考。

关键词:数据挖掘;决策树;体测成绩;Weka

:TP393:A:1009-3044(2018)02-0230-02

ResearchontheScoreofCollegeStudentsPhysicalTestBasedonDecisionTree

LINYi-jun,SHENLiang-zhong*

(SchoolofInformationEngineering,WenzhouBusinessCollege,Wenzhou325000,China)

Abstract:Inrecentyears,thescoreofcollegestudentsphysicaltesthasbeenshowingadownwardtrendwhichattractedmuchattention.Inthispaper,thephysicaltestscoreofourstudentsareused,andthedecisiontreeID3algorithmandthesoftwareWekaareadoptedtoanalyzethefactorsinfluencingthescoreofphysicaltest,whichcanprovidegoodsuggestionsforthestudenttoimprovetheirphysicaltestscore.

Keywords:DataMining;DecisionTree;ScoreofPhysicalTest;Weka

現代科技的发展已经很大程度上改变了现代年轻人的生活方式,通过电脑以及各种移动终端设备能够非常方便的获取各类信息。但是,我们也发现现在年轻人也越来越沉迷于网络世界,越来越多的年轻人更变得越来越宅,积极主动参加户外运动或者锻炼的年轻人变得越来越少。根据2014年国民体质监测公报中有关全国学生体质与健康调研结果,当代大学生身体素质与2010年相比继续呈现下降趋势,同时视力不良检出率又居高不下,继续呈现低龄化倾向,而且各年龄段学生肥胖检出率持续上升[1]。相关研究表明,19岁到22岁年龄组的男生在速度、爆发力、耐力等素质指标持续下降,女生指标也不容乐观[2]。一直以来,国家教育主管部门都非常重视大学生的身体素质健康问题,国家教委、国家体委等相关部门为了鼓励和推动学生积极参加体育锻炼,特意颁布了《国家学生体质健康标准》,要求各学校每学年开展覆盖本校各个年级学生关于该《标准》的测试工作,其中明确指出普通高中、中等职业学校和普通高等学校学生毕业时,如果测试的成绩达不到50分者按肄业处理[3]。

基于当代大学生体质情况对国家未来发展的重要意义,本文使用决策树算法对教务系统中的体测数据进行分析,希望能够得出大学生体质健康检测成绩中的各项目对于成绩影响的结论,提供大学生在体测训练时进行参考,指导大学生通过平时的加强锻炼来增长体测成绩中的短板项目,帮助他们通过体质健康测试,顺利毕业。

1学生体测成绩

1.1数据获取

本文以2016年第二学期我校信息工程学院大三体质测试成绩作为研究对象,该数据从学校教务系统导出,数据具有高完整性。由于男生和女生的体测项目有所不同,故将体测成绩分两大部分进行处理,同时删除姓名,班级等不必要字段,保留各体测项目的成绩信息,对于个别申请免测学生信息进行删除,得到可用数据,男生部分189条数据记录,女生部分28条数据记录。部分数据如表1和表2所示。

1.2数据预处理

由于本文使用决策树ID3算法对数据进行分析处理[4],因此需要对数据进行离散化处理。体测最后的总成绩满分为60分,42分以及以上为及格,42分以下为不及格,以42分为临界点,将及格的成绩记为“Y”,将不及格的成绩记为“N”,将各项体测成绩按照大于等于80分记录为“A”,分数小于80分大于等于60分记录为“B”,小于60分,即本项目成绩不及格的记录为“C”,一共将数据分割为三个层次。同时,将各个项目的列表名字由中文修改为拼音首字母缩写,如50米跑修改为“WSM”,立定跳远修改为“LDTY”,坐位体前屈修改为“ZWTQQ”,男生1000米跑修改为“YQM”,女生800米跑修改为“BBM”,引体向上修改为“YTXS

文档评论(0)

189****4123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档