- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MOOC学习为分析及成绩预测方法研究
MOOC学习行为分析及成绩预测方法研究
近年来,MOOC以“互联网+教育”模式迅速发展,积累了海量学习行为数据,MOOC学习行为分析及成绩预测成为研究热点。笔者收集学习行为数据,用Clementine构建了MOOC成绩预测模型,为验证其有效性,依托智慧树平台数据结构课程的行为数据展开实证研究,旨在为其课程团队提供指导意见。
中国论文网 /1/viewhtm
【关键词】MOOC 数据挖掘 回归分析 成绩预测模型
MOOC(Massive Open Online Course)的理想是任何人在任何时间和地点学到任何知识。2012年斯坦福大学等名校组建了Coursera、Udacity和edX平台。2013年清华北大等名校和互联网公司展开了MOOC实践,研发了学习者在线交互平台,为分析成绩与行为的关系提供数据支持。国内在部分课程上进行MOOC教学但实证研究较少。蒋卓轩[2]首次描述中文MOOC学习行为并预测成绩。Suhang Jiang用绩效考核和公开课结合进行一周的干预,用logistic回归分析预测成绩验证了及时干预的激励作用。笔者理论上对比国内外学习行为分析及成绩预测成果,用线性回归分析构建了MOOC成绩预测模型;实践上用Clementine进行实证研究,预测效果良好并提出应用方案,为教师的决策支持提供严谨的数据保障。
1 成绩预测模型构建
笔者分五个模块构建了MOOC成绩预测模型(图1)。
模块一:确定变量初始集。根据预测目标确定变量范围,回归分析的前提是因变量为数值型变量。
模块二:全部变量进入回归方程。选择进入法和逐步法将全部变量加入方程中便于对比预测结果。
模块三:筛选重要影响变量进入回归方程。为保证结果的普适性,需要对变量初始集依次进行散点图分析、统计量分析和特征选择,剔除相关性弱的构成变量集3。在变量集3上选择上述两种方法进入方程。
模块四:评估预测模型确定最优回归模型。方程通过回归方程的拟合优度检验、回归方程的显著性检验和回归系数的显著性检验后才能用于实际问题,通过评估模块二、三的模型确定最优模型。模块五:呈现预测模型结果。模型结果直观呈现变量关系,形式为Y=ε+β0+β1X1+β2X2+…+βkXk。因变量Y为总成绩;ε为误差且ε~N(0,σ2);β0…βk为未知参数;自变量X1…Xk为影响因素。
2 实证研究
在2015年3月至6月数据结构的学习行为数据上展开研究,因为有本校学生参与,分析结果可信度强。所用设备是Intel Core i3处理器,Win 7操作系统,2.27GHz主频,6G内存。
2.1 研究过程
模块一:预处理行为数据存入learner_all表得到变量初始集。总成绩为因变量Y,自变量是学生编号、学校编号、持续时间、学习进度、观看时长、笔记数、一~七次作业成绩、发帖数、回帖数、得分帖数、一~六次见面课成绩、在线成绩、论坛得分、见面课成绩和期末成绩,编号为X1~X26。
模块二:X1不起作用将其过滤;将总体样本分区70%为训练集30%为测试集;添加回归模型目标为总成绩,选择进入法和逐步法使全部变量进入方程,为模型结果连接表输出和分析节点,执行数据流(图2)显示结果。
模块三:一是散点图分析:读入learner_all设置总成绩为输出其它变量为输入;添加散点图节点Y轴为总成绩X轴为25个自变量,X2、X9、X10与Y不相关将其剔除得到变量集1。二是统计量分析:添加统计量节点由Pearson相关性强度得知X3与Y相关性弱剔除后构成变量集2。三是特征选择:添加特征选择节点目标为总成绩输入为21个自变量,其中X4变异系数低将其剔除形成变量集3。为变量集3添加分区节点设置同模块二;添加回归模型选择进入法和逐步法执行,为模型结果连接表输出和分析节点,执行数据流(图2)显示结果。
模块四:
(1)回归方程的拟合优度检验
依据判定系数R2和估计标准差来检验,R2越接近1表明拟合优度越高。进入法使变量进入方程(无论筛选变量与否),R2均为1表明拟合优度高。逐步法进入方程R2为1估计标准差为0.314小于进入法的0.331,显示出逐步法的优越性且拟合优度提高。
(2)回归方程的显著性检验
依据概率p值、残差平方和、残差均方进行检验,p小于0.05表明因变量与所有自变量线性关系显著。进入法使变量进入方程(无论筛选变量与否),p为0线性关系显著。表明筛选变量后方程变精练预测能力未减弱。逐步法建模后残差均方减至0.110小于进入法的0.111,p为0线性关系显著。
(3)回归系数的显著性检验
依据概率p值进行检验,p小于0.05表明自变量与因变量线性关系显著。进入法使
您可能关注的文档
- Datin比处对象更重要_00002.doc
- DCS集散控制系统故障原因及运行管理体会.doc
- DCS自动控制系统应用研究.doc
- DCS集散控制系统故障原因及运行管理探讨.doc
- DCS控制系统改造实践.doc
- DCS集散控制系统设计组态及其在发电行业应用.doc
- Datng比处对象更重要.doc
- DCT变换域数字水印技术研究.doc
- DCY 电阻率测试仪常见故障排除方法.doc
- DC―DC 电源应用设计研究.doc
- [++初中数学]+第2课时+从不同方向观察立体图形和立体图形的展开+++课件+人教版七年级数学上册.pptx
- [++初中数学]第4课时+方案选择问题(27页)+++课件+人教版数学七年级上册.pptx
- [++初中数学]+第2课时+角的平分线++课件+人教版数学七年级上册.pptx
- [++初中数学]+第2课时+方程的解及一元一次方程++课件++人教版数学七年级上册.pptx
- [++初中数学]成比例线段第2课时++等比性质课件+北师大版九年级数学上册.pptx
- [++初中数学]+第1课时+认识几何体课件+人教版数学七年级上册.pptx
- [++初中数学]第3课时+去括号解一元一次方程(23页)+++课件+教版数学七年级上册.pptx
- [++初中数学]二元一次方程组及其解法第3课时课件+沪科版数学七年级上册.pptx
- [++初中数学]几何图形初步+复习课+课件+人教版七年级数学上册.pptx
- [++初中数学]+二元一次方程组及其解法第1课时课件+沪科版数学七年级上册.pptx
文档评论(0)