基于Python的高职院校学习平台数据挖掘研究.docxVIP

基于Python的高职院校学习平台数据挖掘研究.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

?

?

基于Python的高职院校学习平台数据挖掘研究

?

?

宋永生

摘要:高职院校学习平台积累了大量的数据,而这些数据没有得到充分有效的利用。Python简洁易用,深受人们喜爱,积累了大量可用于数据挖掘的程序库。利用开源机器学习库Scikit-Learn及开源深度学习库Keras分别对学习平台中的结构化数据和非结构化数据进行挖掘分析,挖掘结果可用于教师改进教学及学生改进学习。

关键词:学习平台;Python;数据挖掘;Scikit-Learn;Keras

:TP311:A:1009-3044(2018)33-0015-03

Abstract:Thelearningplatforminhighervocationalcollegeshasaccumulatedalargeamountofdata,whichhasnotbeenfullyandeffectivelyutilized.Pythonissimpleandeasytouse.Itislovedbymanypeopleandhasaccumulatedalotofprogramlibrariesthatcanbeusedfordatamining.TheopensourcemachinelearninglibraryScikit-LearnandopensourcedeeplearninglibraryKerasareusedtomineandanalyzethestructuredandunstructureddatainthelearningplatformrespectively.Thedataminingresultscanbeusedforteacherstoimproveteachingandstudentstoimprovetheirlearning.

Keywords:Learningplatform;Python;Datamining;Scikit-Learn;Keras

近年來国内很多高职院校上线了在线学习平台,为高职院校教师的教学及学生的学习提供了便利,在线学习平台由此积累了大量的数据。在数据价值日益凸显的今天,高职院校在线学习平台积累的数据并没有得到充分有效的利用。原因主要有以下三个方面:首先,很多高职院校的学习平台是由软件公司开发,教师对学习平台的库结构不清楚,数据挖掘便无从谈起;其次,现有学习平台的设计存在缺陷,没有考虑到后续的数据挖掘,一些关键字段没有存储,从而造成积累的数据无法进行数据挖掘或数据挖掘效果欠佳;再次,很多高职院校缺乏进行数据挖掘的软件及硬件平台。

数据挖掘是从海量数据中抽取前所未知可理解可操作信息的过程,机器学习是常用的数据挖掘手段。Python是一种面向对象的解释型程序设计语言,由于Python简洁易用,可跨平台运行,深受人们喜爱,积累了丰富的开源程序库。机器学习是计算机程序针对某个特定的任务,从经验中学习且越做越好[1],机器学习的应用非常广泛。深度学习是机器学习的一个分支,近年来大放异彩,这主要得益于硬件的发展、互联网产生的大量数据及算法的改进,深度学习在视觉识别、语音识别及自然语言处理等方面都有广泛的运用。

本文将Python中的机器学习库Scikit-Learn及深度学习库Keras分别应用到高职院校学习平台的结构化数据及非结构化数据的挖掘研究中去。在数据挖掘之前,首先要对学习平台的数据要有充分的了解。

1学习平台的数据

学习平台的数据主要分为存储于数据库中的结构化数据及存储于文件系统中的非结构化数据。学习平台的数据总览如图1所示。

1.1结构化数据

学习平台数据库中主要有课程信息表、知识点信息表、题目信息表、试卷信息表、考试信息表、学生信息表、教师信息表、日志信息表等。

课程信息表包含课程代码、课程名称、课程简介、课程目录、课程评价、课程评分、授课教师、选修人员、开始时间、结束时间等信息;知识点信息表包含知识点名称、所属课程、视频地址、视频描述、相关附件、学生评价、评分、发布人、发布时间、播放次数等信息;题目信息表包含课程名称、知识点、题型、试题难度、试题分数、试题内容、选项、标准答案、解析、提交人等信息;试卷信息表包含试卷名称、命题人、题量、总分、题目、考试开始时间、考试结束时间、参考人员、阅卷人员等信息;考试信息表包含账号、试卷名称、知识点、考生答案、答题时间、得分等信息;学生信息表包含账号、姓名、性别、年龄、手机号、受教育程度、感兴趣的领域等信息;教师信息表包含账号、姓名、性

文档评论(0)

177****5771 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档