教育大数据背景下log数据挖掘与_省略_2012_中国区问题解决测验为例_要.docxVIP

教育大数据背景下log数据挖掘与_省略_2012_中国区问题解决测验为例_要.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电化教育研究 电化教育研究 2017年第12期(总第296期) 2017年第12期(总第296期) PAGE PAGE # PAGE PAGE # PAGE PAGE # 网络出版时间:2017-11-30 08:39:01 网络出版地址: /kcms/detail/62.1022.G4.20mi30.0839.004.html 电化教育研究 D01:10.13811/ki.eer.2017.12.009 | 学习环境与资源 教育大数据背景下log数据挖掘与应用 ——以PISA(2012)中国区问题解决测验为例 首新\叶萌S胡卫平\刘念2,王红艳3 (1.陕西师范大学现代教学技术教育部重点实验室,陕西西安710062; 2.重庆市中山外国语学校,重庆404500;3.渭南师范学院教育学院,陕西渭南714000) [摘要]log数据是教育大数据的一个子集,为分析问题解决过程提供了新的思路。文章截取PISA(2012)中国区的 log数据,采用关系挖掘、聚类等教育数据挖掘方法,分析“交通”一题的答题时间、鼠标点击数,以及使用“有目的试误”策 略情况。结果显示:(1)台湾和上海形成强烈反差,上海学生在高百分位上的解题时间和鼠标点击次数都较低,说明他们 可能更在意时间成本;(2) “有目的试误”策略不仅有助于解答“交通”一题,其在体现个体问题解决能力中仍处于重要位 置;(3)依据使用“有目的试误”策略的程度,学生的问题解决过程可分为5个群组(最优组、有目的试误组、其他策略组、 只顾玩乐组、功能障碍组),台湾在“最优组”表现最好,香港在“只顾玩乐组”“功能障碍组”比例最高。可见,log数据在分 析问题解决过程、辨别问题解决群组、发展基于证据的教育决策等方面有其重要作用。 [关键词]教育大数据;PISA;问题解决;log数据 [中图分类号]G434 [文献标志码]A [作者简介]首新(1987— ),男,重庆梁平人。博士研究生,主要从事科学教学心理研究。E-mail:346532216@。胡 卫平为通讯作者,E-mail: weipinghu@ 163.(301110^ 一、问题的提出 教育网络资源的激增(如慕课、在线课堂、精品课 程资源)加快了数据的传递与扩张,用户与学习系统 的交互行为被传感器、后台等以日志的形式保存下 来,这些日志信息被称为log数据。log数据是教育大 数据的一个子集,国际大型测评项目PISA(2012) (Program for International Student Assessment)已全面 在计算机环境下评估问题解决能力,而测验过程记录 的log数据也成为分析全球15岁学生问题解决过程 的重要依据。计算机记录的log数据能够有效收集问 题解决过程的所有操作,反映所有行为,进而可能有 助于教育工作者从中捕捉学生问题解决的特点,为后 续教学干预提供有效的证据[1]。 log数据为分析教育大数据背景下的问题解决行 为提供了新思路,可以检验学生问题解决的投入度、 目标达成情况以及认知策略等[2]。本研究着眼于用 PISA(2012)中国区(上海、香港、澳门、台湾)问题解决 log数据来分析问题解决过程,并比较策略、模式上的 异同,从全新的视角考察学生的问题解决行为。 二、教育数据挖掘 教育数据挖掘过程 教育数据多为半结构化的、过程性的、状态性的、 反映学习行为的原始数据,对教育数据的深度挖掘就 是从海量数据集中自动提取不明确的或研究者感兴 趣的原始数据量的过程,参考Baker[3]、Romero[4]、杨文 佳[5]等人的观点,其过程可概括为原始数据预处理 基金项目:北京师范大学中国基础教育质量监测协同创新中心研究生自主课题(课题编号:SXSP-2016A2-15001);中央高校基本科 研业务费专项资助“基于项目的STEM学习国际比较研究”(项目编号:2016CBY017) (Pre -processing )、数据挖掘(Data Mining)、事后处理 (Post-processing )三个阶段。 首先,要对某教育系统获得的原始数据进行预处 理,包括选择和筛选、数据格式和形式等的转化、类型 的合并等。若数据来源于不同数据库,还应根据研究 目的、实验设计、变量等因素统一数据类型,使之能被 分析软件正确读取。完成数据预处理后,便可使用数 据挖掘技术进行分析。美国《通过教育数据挖掘和学 习分析促进教与学》报告归纳了 5类教育数据挖掘技 术,包括预测、聚类、关系挖掘、数据精馏与人工判断、 模型建构与发现等M,本研究主要采用了聚类、关系挖 掘。最后,基于数据挖掘结果须进行事后处理,对结果 进行解释与评估,并据此提出改善学习系统、优化学 习活动等方面的建议。 l〇g数据及其分析 计

您可能关注的文档

文档评论(0)

txy_1530 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档