基干R语言Moodle平台数据挖掘技术研究.docVIP

基干R语言Moodle平台数据挖掘技术研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基干R语言Moodle平台数据挖掘技术研究

基于R语言的Moodle平台数据挖掘技术的研究   摘要:本文利用R语言对Moodle平台的数据进行分析研究。对平台模块访问总体情况、学生学习时间分布统计、师生交互网络等进行图形化的直观展示。该研究有利于教师掌握学生学习的总体情况,有针对性的指导和督促学生 关键词:R语言;Moodle;数据挖掘 一、引言 随着近年来网络课程、在线学习等应用的兴起,学习平台逐渐积累了大量的用户基本数据、行为数据、网络痕迹数据等信息。而”用数据说话”、”用数据决策”等已经成为信息时代倡导的未来发展基石。因此,如何利用大量的数据挖掘出有价值的信息,成为研究者重点要解决的问题 二、R语言简介 R语言是一种为统计计算和图形显示而设计的语言环境,是贝尔实验室(Bell Labortory)的Rick Becker、John Chambers和Allan Wilks开发的S语言的一种实现,提供了一系列统计和图形显示工具。它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。本文主要应用R语言的如下优势: (1)R可以轻松地从各类型的数据源导入数据,包括文本文件、数据库管理系统、统计软件,乃至专门的数据仓库。它同样可以将专门的数据输出并写到这些系统中 (2)具有高效的开放性,R不仅提供功能丰富的内置函数供用户调用,也允许用户编写自己定义的函数来扩充功能 (3)R拥有顶尖水准的制图功能。如果希望复杂数据可视化,那么R拥有最全面且最强大的一系列可用功能 R是一个体系庞大的应用软件,主要包括核心的R标准包和各专业领域的其他包。R在数据分析、数据挖掘领域具有特别优势 三、R语言数据分析 1.moodle平台模块总体访问情况研究 首先利用爬虫爬取到Moodle平台用户访问数据两万余条,部分数据展示如表1所示: 利用R语言提取moudle列数据,即平台模块列,并对提取数据进行词频统计,得出各模块的词频数如表2所示: 利用R语言强大的绘图功能,使用ggplot()函数对各模块访问词频数绘制圆形饼状图,这样可以直观地展现用户对各模块访问情况,绘制出Moodle平台模块访问总体情况饼状图如图1所示: 在该课程学习的过程中,师生访问平台模块的频次统计饼状图,用以找出学生更热衷于哪一版块的学习内容。从图1可更加直观的看出,师生最常访问的模块是forum(26.3%)论坛区,课堂的讨论参与的人次数较多。其次是course(24.5%)课程模块,再次是assignment(22.6%)作业模块,然后是resource(16.1%)资源模块。可见,学生在该平台的访问行为,都是比较集中地围绕学习活动进行的 2.学生学习时间分布统计 热力图是一种非常常用的统计图形,该图将两个变量(一般是离散变量)的交叉汇总信息以颜色的形式展现出来,而映射给颜色变量的是连续型数值变量,下面就以例子说明热力图的优势: 热力图可以通过stats包的heatmap()函数绘制,也可以通过ggplot2包中的geom_tile()函数或geom_raster()函数绘制,本文使用ggplot2包中的函数实现 首先将所需数据进行提取,分别提取出月份、小时、分钟信息,部分数据展示如表3所示: 通过对ggplot2包的调用,调用geom_tile()函数,绘制学习时间分布热力图,如图2所示: 进一步按照月份进行分类,分析学生学习访问时间是否与月份有关。在按照月份进行分类的同时,按上、下午进行分类,分析学生学习访问时间是否与上、下午有关。进而细化到时间点,分析学生学习访问时间黄金时段。利用R语言绘制学习时间分布圆饼图如图3所示: 由图3可看出学生学习时间安排与月份无关,多数学生更偏向于下午学习,而每日学生学习的黄金时段为上午八点到十点,下午两点到四点。进而通过此信息,可在此时段保证各科均有老师在线答疑,而其他时段,可轮流值班的安排方案,最大限度的提高教师指导学生的效率 3.师生交互网络分析 从Moodle平台获取的师生交互数据如图4所示: 例如id=2的用户,他发了id=5的留言。在图4中有8个回复,分别是用户id=2、30、92、66、89、49、69、2这几个用户。说明id=2的用户,跟id=2、30、92、66、89、49、69、2的这几个用户有交互。去掉其中自己跟自己的交互,可将用户的交互用图5表示: 首先做数据筛选,整理出交互数据部分如表4所示: 利用R语言做交互分析,绘制师生交互网络图,如图6所示: 图6中线的透明度代表交互的强度,具体来说就是回帖的数量越多,线的颜色就越深。其中2号代表老师,用红色表示。其他代号为学生,用蓝色表示。从图中可直观看

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档