- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大数据技术高校实践教学研究
基于大数据技术高校实践教学研究
摘 要:运用大数据技术,以高校传统实践教学资源和信息管理资源的对象,进行数据收集与提取、存储与管理、挖掘与分析、成果展示等流程分析,科学管理高校实践教学资源,提高高校实践教学质量,培养创新实用型人才。
关键词:教学资源;大数据技术;实践教学
中图分类号:G642 文献标志码:A 文章编号:1002-2589(2015)03-0188-02
中国高等教育已经由精英教育过渡到大众教育阶段,作为高等教育生命线的教育质量深受关注。教学实践表明:制约培养高质量人才的瓶颈――实践教学环节的教育质量――是提高“以就业为导向”高级实用型人才的关键。为了提高高校实践教学环节的教育质量,培养创新实用型人才,教育部出台“高等学校本科教学质量与教学改革工程”的意见,总结出增强实践教学环节,提高学生的创新意识、实践能力、社会责任感和就业能力的相关办法。因此可见,加大高校实践教学环节实施力度有助于提高培养人才质量,促进培养人才创新。
加强实践教学环节的提出导致高校教育理念发生转变,根据学科规划,广大高校加大了实践教学的投入力度,进而实践教学的软件和硬件环境均得到改善。但是,由于高校招生规模扩大,教育的层次多元化发展,高校实践教学出现教学资源不平衡、利用分散、效率低下等问题。本文运用大数据技术,对于现有的实践教学资源进行数据挖掘与分析,并将结果用于教学资源管理,进而提高实践教学的效率,为社会培养创新应用型人才。
一、高校实践教学资源
高校实践教学资源是高校实践教学的基础,决定着实践教学成功与否,因此,提高现有的资源利用率是改善实践教学质量的有效途径。高校实践教学资源是指高校在教育学生期间所有的基础实践教学硬件设施如教学楼等、建设实践教学的资金如校外实习经费等、领导实践教育的师资队伍等要素的综合装备和利用能力的总和(图1)。然而,高校的信息系统是数据生产的巨户。学生的视角来看,包括联系方式、家庭住址等基本的信息,校园卡消费、宿舍使用时间等生活信息,选课、图书借阅、学科成绩等学习信息,参与的社团、比赛、讲座等第二课堂信息;从教师的视角来看,包括联系方式、受教育历程等基本信息,教学任务、教学内容(一般以课件的形式)等教学信息,论文著书、科研数据等科研信息;从高校管理者的视角来看,包括高校的资产信息、师资信息、招生就业信息、校企合作信息、校间合作信息等。同时,移动互联网和物联网技术的发展,高校校内人员主动生成或者有设备手机的信息也在时时更新,例如,微博、微信、QQ等社交信息,BBS搜索点击信息等。这些就是高校信息系统中的数据,也是高校的实践教学资源。同时,这些数据资源与传统的实践教学资源相辅相成。
■
二、大数据处理一般流程
大数据的处理流程具有一般数据处理流程的共性,可以定义为:运用合适的工具抽取和集成广泛异构的数据源,遵循特定的标准,将所得的结果统一存储,采用适用率高的数据分析技术分析存储的数据以获取有价值的知识,并且将这些知识以可视化的方式展示给终端用户。大数据处理的一般流程为数据的抽取与集成,数据存储,数据分析和数据展示(图2)。
■
1.数据来源。大数据的数据源非常的广泛,它包括传统的关系型数据库、XML等半结构化数据、以文本、音频、视频和其他形式存在的非结构化数据。当前,高校已经建立了基本的管理信息系统、教学管理系统、图书馆管理系统等,在同一的数据中心,汇聚了大量结构化数据、半结构化和非结构化数据。
2.数据的存储管理。根据数据源的不同,采用不同的数据提取方式。对于结构化的数据,采用ETL工具,将数据抽取存储于HBase数据库中;对于Web网页等此类非结构化的数据,采用Nuth技术进行抽取,Solr技术进行索引,之后存储于HBase数据库中。HBase数据库是一个开源的分布式数据库,具有高可靠性、高性能、可伸缩的特性,并且不是以关系模型为基础建立的,可用以存储大规模结构化数据。
3.数据挖掘与分析。采用Hive技术对HBase数据库中的数据进行挖掘与分析。hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。通过Hive可以实现数据的汇总统计分析,并且易于扩展器计算能力和存储能力。此外,可以运用Mahout机器学习工具对数据进行无监督学习和监督学习。
4.数据分析成果展示。在数据展示层,运用Tableau软件可以实现数据与图表的完美结合,将数据挖掘与分析的成果以可视化
原创力文档


文档评论(0)