基于数据挖掘对影响学习成绩因素的研究.pdfVIP

基于数据挖掘对影响学习成绩因素的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

ELECTRONICSWORLD・探索与观察

基于数据挖掘对影响学习成绩因素的研究

西安交通大学附属中学刘蕴轩

【摘要】

孩子作为家庭、社会的希望和未来,成长备受关注,针对于学习成绩的探讨,甚至经常成为了全社会热议的话题。得益于数据挖掘

技术的快速发展,本文利用IBMSPSSModeler,Excel等软件使用决策树、聚类经典算法,对影响学习成绩的一些因素进行了分析。面对复杂

多重的相关因素,采取分类探究,加权合并的策略逐步将复杂的因素直观化,简单化。初步对学习成绩的相关属性的影响进行了分析。

【关键词】

学习成绩;决策树;数据挖掘

(G1,G2,G3),总共为600多条记录。

1.前言

3.数据预处理

十年树木,百年树人。教育始终是全社会热议的话题。学习

成绩是考核学习能力的重要指标,也是选拔人才的重要标准,倍受由于相关属性过多,不便于直接继续研究。笔者对各项属性

每一个家庭的关注。孩子们的学习能力深刻地影响家庭的未来,甚一一进行筛选,将希望进一步探究的属性分为六大类,分类结果

至国家的兴衰发展。如何有效地提高成绩成为经久不衰的议题。影如表1所示。其中,这三组的属性更加直观地、定量地影响学习成

响学习成绩的因素有很多,其中与孩子的自身相关的因素有心理状绩。本组数据的属性非常多,导致直接构建决策树,会使决策树冗

态、智能水平、学习方法、学习时间,学习习惯等。大多研究都是长且不易分析。减少决策树输入的属性个数是降低决策树长度的有

从主观方面,或者从心理学角度切入,针对孩子的一些自身问题,效方法。为了合理减少输入参数的数量,我们对时间规划、其他教

告诫家长要正确引导,不要给孩子施加太大的压力,要多陪伴和鼓育支持、上进心这三类中的属性进行了加权合并,每组合并为一个

励孩子等等。然而,“心理战术”仍然让许多家长力不从心,效果属性。根据不同属性对结果的影响程度不同,我们采用了加权合并

也并不尽如人意。的办法。为了获得不同因素之间影响程度的对比,我们计算属性的

大数据时代的到来,使得大数据分析技术在很多情况下都能得“信息增益值”,作为属性的权重。“信息增益值”Gain(SA,A)

到一些问题所在。我们在Kaggle网站上得到了一组高中学生学习情的计算公式如下:

况和原生家庭情况的数据记录,这些数据是在针对中学生数学课程

(1)

学习情况的调查中统计得到的。数据包括了家庭与学校的远近、是

否经常参加课外活动、监护人主要为父亲还是母亲、父母的受教育(2)

程度、父母的工作、父母的离异情况以及家庭的规模等。抛开与孩其中,S表示整个样本集合,S表示在节点属性A下的集合。

A

子自身相关的因素的探讨,本文着重探究学习成绩和家庭客观因素Entropy(SA)表示属性A在集合S的熵值。变量N表示属性A上的

AA

的关系。这样的客观因素往往被人们忽视,它们究竟对孩子的学习

文档评论(0)

liushuhua007 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7054124121000035

1亿VIP精品文档

相关文档