- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
ELECTRONICSWORLD・探索与观察
基于数据挖掘对影响学习成绩因素的研究
西安交通大学附属中学刘蕴轩
【摘要】
孩子作为家庭、社会的希望和未来,成长备受关注,针对于学习成绩的探讨,甚至经常成为了全社会热议的话题。得益于数据挖掘
技术的快速发展,本文利用IBMSPSSModeler,Excel等软件使用决策树、聚类经典算法,对影响学习成绩的一些因素进行了分析。面对复杂
多重的相关因素,采取分类探究,加权合并的策略逐步将复杂的因素直观化,简单化。初步对学习成绩的相关属性的影响进行了分析。
【关键词】
学习成绩;决策树;数据挖掘
(G1,G2,G3),总共为600多条记录。
1.前言
3.数据预处理
十年树木,百年树人。教育始终是全社会热议的话题。学习
成绩是考核学习能力的重要指标,也是选拔人才的重要标准,倍受由于相关属性过多,不便于直接继续研究。笔者对各项属性
每一个家庭的关注。孩子们的学习能力深刻地影响家庭的未来,甚一一进行筛选,将希望进一步探究的属性分为六大类,分类结果
至国家的兴衰发展。如何有效地提高成绩成为经久不衰的议题。影如表1所示。其中,这三组的属性更加直观地、定量地影响学习成
响学习成绩的因素有很多,其中与孩子的自身相关的因素有心理状绩。本组数据的属性非常多,导致直接构建决策树,会使决策树冗
态、智能水平、学习方法、学习时间,学习习惯等。大多研究都是长且不易分析。减少决策树输入的属性个数是降低决策树长度的有
从主观方面,或者从心理学角度切入,针对孩子的一些自身问题,效方法。为了合理减少输入参数的数量,我们对时间规划、其他教
告诫家长要正确引导,不要给孩子施加太大的压力,要多陪伴和鼓育支持、上进心这三类中的属性进行了加权合并,每组合并为一个
励孩子等等。然而,“心理战术”仍然让许多家长力不从心,效果属性。根据不同属性对结果的影响程度不同,我们采用了加权合并
也并不尽如人意。的办法。为了获得不同因素之间影响程度的对比,我们计算属性的
大数据时代的到来,使得大数据分析技术在很多情况下都能得“信息增益值”,作为属性的权重。“信息增益值”Gain(SA,A)
到一些问题所在。我们在Kaggle网站上得到了一组高中学生学习情的计算公式如下:
况和原生家庭情况的数据记录,这些数据是在针对中学生数学课程
(1)
学习情况的调查中统计得到的。数据包括了家庭与学校的远近、是
否经常参加课外活动、监护人主要为父亲还是母亲、父母的受教育(2)
程度、父母的工作、父母的离异情况以及家庭的规模等。抛开与孩其中,S表示整个样本集合,S表示在节点属性A下的集合。
A
子自身相关的因素的探讨,本文着重探究学习成绩和家庭客观因素Entropy(SA)表示属性A在集合S的熵值。变量N表示属性A上的
AA
的关系。这样的客观因素往往被人们忽视,它们究竟对孩子的学习
文档评论(0)