- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
北京软件或统计及数学或信息科学学院
大数据实验室建设方案
一、大数据实验室建设目标
在2017年7月颁布的《教育部关于新形势下进一步做好普通学校装备工作的意见》
中,明确指出要“按照标准建设实验教学和音体美装备和场所。支持探索建设综合实验
室、特色实验室、学科功能教室、教育创客空间等教育环境。鼓励对现有教室进行多功
能技术改造,适应学生学习需求”。
为更好的加强信息科学学院的专业技术优势,充分利用信息科学学院现有机房及多
功能教室的教学条件,特申请针对学院的大数据学习及应用需求建设大数据实验室,打
造课程管理平台及科研平台,为老师和学生提供一个学习大数据技术、数据分析与挖掘、
软件开发、工程学等多方面知识的平台和环境。
二、建设方案
大数据实验室计划建设稳定、可靠、高效的软硬一体化大数据教学科研环境,以及完
善的课程体系、项目数据和视频、多样化的教学手段和丰富的实战案例,来满足学生学
习和老师科研需求。主要包括两个部分:
(1)大数据教学平台
大数据课程平台根据不同学历和职业方向设置不同的课程学习路线,针对每门课程
提供教学实验指导手册、在线视频、资源包、实验示例代码等,让学生通过在线学习、
原理验证、实训应用、综合分析及自主设计等多层次的实验操作,实现对大数据开发应
用的理解和掌握。行业典型项目涵盖互联网、运营商、金融、电子商务、政府等十多个
领域,通过项目指导手册、讲解视频、行业数据及项目代码等进行充分学习。
平台整体以大数据Hadoop及其生态组件为核心构建软件系统,支持更多的大数据高
级特性,保证平台的高性能与稳定可靠运行。
(2)大数据科研平台
结合大数据解学平台的教学内容,通过科研平台进行上手实践操作。科研平台融合大
数据相关的开源开发工具,构建包括搜索引擎、自然语言处理、数据可视化等开发工具
等开发框架平台,充分进行处理采集、治理、挖掘等项目的研究和探索,全面提升科研
成效。
(3)教室布局
采用普通终端PC机,组成实验室局域网,支撑学生进行大数据实验
三、实验室建设可行性
1、教育部鼓励高校对现有教室进行多功能技术改造,适应学生学习需求。信息学院
现有机房设备及教学场地闲置,可充分利用进行大数据实验室建设。
2、信息科技学院作为专业化的信息技术学科,老师和学生在基础编程知识储备、项
目分析操作等方面具备了一定基础和优势,有进行大数据学习和使用的技术能力。
四、实验室建设必要性
1、北京XX大学作为XX类学校,在文本识别、自然语言处理等方面有研究需求,
大数据实验室提供的自然语言处理环境将有助于相关领域研究。
2、学生在大数据学习中面临着听不懂、不会做、不会用、学不会等问题,大数据
实验室将理论知识、实验教学和大数据项目实践融合,通过教学视频、课件、配套的实
践工具进行路径化学习,将逐步提升学生的专业技能和项目实践能力,解决学习难题。
3、教师面临着任务重、备课难、实验课难开展、发论文没思路等困扰,通过大数
据实验室的专业数据工具,可以有效匹配教师的科研需求,教师可以在开放高效的平台
下开展大数据科研工作,提升教师的科研创新能力。
五、实验室建设预算
1、大数据教学平台:万
内容:大数据概论、Hadoop集群安装部署、HDFS分布式文件系统、MapReduce计算
框架等课程开始学习;再进行实时计算:Storm实时流计算框架、Zoopkeeper分布式协
调系统、Kafka分布式发布订阅消息系统、Flume海量日志采集系统、HBase分布式数据
库等课程的学习;再到离线计算:工作流引擎Azkaban、ETL工具Sqoop、数据参数Hive
的学习;最后进行大数据高级进阶:Scala基础编程、Scala核心概念、Scala高级编
程、Spark、SparkSQL、SparkStreaming、MLlib开发和Graphx等课程的学习
课件:包括教学实验指导手册、操作视频、实验资源包、实验示例代码等
2、大数据科研平台:万
集成众多大数据开发技术。主要涵盖:数据源
文档评论(0)