- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据技术在高校学生助学金评比中应用
大数据技术在高校学生助学金评比中应用 摘 要:高校助学金评比主要依据为学生家庭经济情况,如何通过学生档案数据、校内外兼职数据和校内一卡通使用相关数据真实反映学生经济状况是关键。文章针对这一问题提出使用PostgreSQL作为非关系型数据库,使用可编程统计分析软件R对存储流进行分析和建模后数据挖掘,通过对上述数据进行采集、数据提取和存储、数据计算和分析等过程,产生学生消费数据分析汇总表,作为学生助学金评比的重要依据
关键词:大数据;助学金;PostgreSQL;统计分析软件R
文章编号:1672-5913(2017)05-0154-04
中图分类号:G642
1 大数据技术和高校学生行为活动中大数据的产生
1.1 大数据的产生
随着计算机相关信息技术和互联网技术的推广与发展,互联网根据应用协议在信息传输中大规模运用“请求”+“响应”模式。所有接入互联网的设备、软件等客户端通过发送数据主动提出服务请求,服务器端会根据指令发送相应的请求数据,用户在客户端上的每一次访问请求其实就是一次鼠标点击或键盘输入数据的操作,在服务器的操作日志中,会忠实地记录下每个人“访问的时间、请求的命令、访问的网址”[1]等数据。用户在网络上或各种应用系统操作中产生的各种数据就像生活中不经意间留下的各种各样痕迹一样,这些痕迹串连到一起,交织成了网民们在互联网上的各种行为轨迹。这些貌似杂乱无章的各种庞大数据,经过量的积累完成了质的飞跃,数据中蕴含着巨大的价值
类似的数据之间“具有非关系型、无序”,被称为非结构化大数据,包含文字、图片、视频、音频等[2],过去几十年中已经积累了好多,未来还会有更多的数据呈几何级数增长,而云计算的产生和云技术的不断成熟,为大数据的存在提供了巨大的存储空间和合理的访问技术,为数据分类、查询和透视分析带来了可能,从而使得大数据技术成为信息技术发展到一定阶段后再次产生质的飞跃的必然产物
1.2 高校学生活动中的大数据
高等学校是一个人员非常密集的生活教育场所,校内学生是信息技术的天然受众,学生的出行、购物、饮食起居、生活娱乐、接受教育等过程中,各种数据终端的使用和各种系统的应用,会在无形中产生巨大的数据量。如果对这些数据加以运用,可以更好地改善学生生活服务质量,提升服务水平
(1)高校原始基本数据的产生。主要是指学生和学校原始基本数据的录入,如每年的“高等学校数据平台”和“高等学校基层统计报表”中学校相关数据的全方位输入、学校固定资产管理系统中资产增加或淘汰后的信息更新、高校实验室信息管理系统中实验实训设备数据的更新以及每年新生入学后所有新生基本数据的导入
(2)应用系统中数据的产生。目前学校使用的各种信息化系统主要有进出校门的门禁系统、平时服务的校园一卡通系统、教学管理方面的教务管理系统和学工管理系统、学生学费管理方面的财务管理系统、图书借阅方面的图书管理系统、行政办公方面的OA办公系统、学生联系方面的校迅通、固定资产管理方面的资产设备管理系统,另外还有校园BBS和百度贴吧中的各种文本内容和视频监控系统中的各种数据。以上一系列信息设备的使用,不仅仅方便了高校管理,而且在系统使用过程中产生出大量的中间数据,这些来源广泛的数据,其类型呈现多样化的形式,有结构化数据、半结构化数据和视频、音频、图形等非结构化的数据。这些中间数据和互联网上相关的学生活动数据整合起来,和基础数据一起进行过滤、清洗与整合,共同组成能反映学生各方面生活学习细节的原始大数据
2 学生助学金评比中涉及的相关数据
通过与学生资助管理部门工作人员、高校中各系分管学生工作人员和辅导员沟通交流,他们一致认为学生助学金和学生奖学金是有很大区别的,它存在的目的为资助家庭经济困难学生完成学业,因此评比标准中最重要的一条就是学生家庭经济情况。大数据技术使用的最终目的是如何真实反映学生家庭经济情况,数据的采集和整理可从以下几方面考虑
(1)学生学籍档案中体现出的各种数据,如家庭年收入情况、父母居住地为农村或城市、是否为单亲或离异家庭、父母工作单位、主要社会关系、学生健康状况等各种数据,这些信息可以作为评定学生助学金的一个重要参考,但由于助学金评定范围广、参与学生多,对一些家庭经济情况不太明显的学生,参考价值就不是太大
(2)学生校内外兼职数据。这个数据主要涉及两方面,一方面是兼职迟早问题,也就是大一就开始兼职,还是大二或大三才开始兼职,兼职越早从理论上来说,家庭经济情况可能更差;另一方面是兼职时间问题,每周多少小时,时间越长、权重越高,有的学生可能有几份兼职;最后是兼职地点问题,校外兼职还是校内兼职
(3)学生在校内餐厅、小卖部等处刷卡消费数据。这个是学生助学金发放依据的主要数据,最能说明问题,由以下几点组
文档评论(0)