数据科学专业人才培养的研究.docVIP

  • 7
  • 0
  • 约3千字
  • 约 7页
  • 2018-10-17 发布于福建
  • 举报
数据科学专业人才培养的研究

数据科学专业人才培养的研究   摘 要:在大数据时代,数据已成为一种新的“石油”,爆炸式增长的海量数据驱动着行业的转型和升级。以数据为驱动,挖掘其中的价值以揭示自然、社会现象的特征和规律,则是数据科学人才的使命。然而,数据科学人才储备在目前远远不能满足社会需求。作为培养人才的主力军,高校应积极响应国家对复合型人才的需求,着手培养满足社会发展需求的数据科学人才。从高校角度出发,分析了数据科学人才培养的先决条件、课程体系的设置以及相应的授课模式,以期抛砖引玉。   关键词:数据科学;人才;课程   一、数据科学人才需求   数据科学强调以数据为导向,是一门交叉学科,结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算、社会科学等,目标是用数据揭示复杂的自然、人类和社会现象的特征或规律。具体而言,数据科学主要有两个内涵:一是研究数据本身,研究数据的各种类型、状态、属性以及变化形式和变化规律;二是为自然科学和社会科学研究提供一种新的方法,称为科学研究的数据方法,其目的在于揭示自然界、社会的现象和规律[1]。   正是数据科学的提出与发展,为目前火热的大数据的发展与应用提供了理论支撑[2],以致形成了科学研究的第四范式――数据密集型科学研究。与主张模拟仿真的第三范式相比,第四范式则是以数据为导向,主张从数据出发,通过观察、分析数据,提炼出信息、知识、理论,发现规律。无论是大数据技术还是第四范式,均需依托于数据科学。与计算机科学相比,数据科学的内涵和外延更加宽泛[3]。   在我国,未来3~5年需要180万数据科学人才,但目前只有约30万人。面对此缺口,高校应尽快制订培养方案,设置课程体系,投入师资,以培养出满足社会发展需求的数据科学人才。   二、国内外培养现状   在美国,很多知名大学都已设立了数据科学专业硕士学位,如纽约大学、哥伦比亚大学、伍斯特理工学院、弗吉尼亚大学、北卡罗来纳州立大学、东北大学、德州农工大学、路易斯安那州立大学、加州大学伯克利分校等。纽约大学和哥伦比亚大学还设置了博士学位。在英国,邓迪大学、谢菲尔德大学和爱丁堡大学设立了硕士学位。   在我国,复旦大学、清华大学、香港中文大学都设置了硕士学位。中国科学院、中山大学、华东师范大学等成立了数据科学研究机构。2015年,阿里云、慧科教育启动了“阿里云大学合作计划AUCP”,已与多所高校联合,拟培养和认证一批云计算和数据科学人才。   虽然数据科学方向的人才培养在国内高校中受到了重视,但学科体系并没有建立起来,人才的培养缺乏系统性。   三、人才培养思路   与传统学科不同,对数据科学方向的人才需求是市场驱动的。因此,数据科学的学科体系构建的原则应是针对各种应用,所培养的人才能够理解应用需求,根据需求设计算法级别(或系统级别)求解框架,具备较强的数学建模能力,能够使用合适的工具进行数据分析,搭建计算平台,并能够通过提供一定的算法将数据的价值挖掘出来。   1.先决条件   为了开设数据科学专业,高校需满足一些先决条件。第一,计算条件。第二,数据资源。高校应建立实验场,提供足够的多样数据或数据源。充足的数据资源有助于学生实践操作,有助于学生的学以致用。第三,师资条件。这是人才培养的关键因素。目前,这方面的师资力量比较匮乏,为了培养数据科学人才,需要不同专业背景的教师协同合作。第四,如果有条件,高校应与政府、企业合作。高校的优势在于理论和技术研究,但并没有数据应用场景,通过与企业、政府合作,可以弥补这一点,并且更易获得充足的数据资源,同时可以从政府、企业吸取具有一线工作经验的人才,以补充师资。   2. 课程设置   具备先决条件后,我们来分析怎样为数据科学专业配置课程。要想做一位完美的数据科学家,至少需要具备统计学、编程功底,同时需要具备一定的领域知识和良好的沟通能力。只有具备统计学和编程能力还不够,处理数据不仅需要理论和技巧,更需要领域知识的支持,并以此获得对数据的敏感度和洞察力。完美的数据科学家需要能够处理好关于数据的方方面面:不仅能从理论角度进行分析建模,还能够运用技术手段进行分析、描述、预测,并能让结论落地,服务于现实中的行业,让数据的价值得以变现。   因此,在设置课程时,四类课程不可少。一是统计学。许多知识挖掘方法都源于统计学的模型。二是数据分析。培养学生建模的能力,并能使用工具进行数据分析。三是分布式计算、并行计算。大数据时代,数据规模往往很大,非单机环境能够承受,这就需要面向集群环境进行系统架构,编写高效的分布式或并行计算算法。四是机器学习、数据挖掘。除此之外,还应学习一定的领域知识,如财务分析、服务业中的分析、健康医疗、供应链管理、综合营销沟通中的概率模型等,这样才能够

文档评论(0)

1亿VIP精品文档

相关文档