大数据思维下科学化开展新生适应性教育研究与探索.docVIP

大数据思维下科学化开展新生适应性教育研究与探索.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据思维下科学化开展新生适应性教育研究与探索

大数据思维下科学化开展新生适应性教育研究与探索   摘要:本文以北京航空航天大学学生为研究对象,运用大数据思维和分析方法,基于“梦拓计划”搭建信息平台并采集新生行为数据,根据新生的关注热点研究大学新生的群体性特征,以探索新生适应性教育的科学规律。   关键词:新生教育;大数据;科学化;梦拓计划   中图分类号:G40文献标志码:A文章编号:2095-9214(2016)03-0297-01   一、 引言   本文以新生适应性教育为切入点,基于北京航空航天大学“梦拓计划”,通过平台研发、数据采集、模型构建和特征提取,将“Mentor”的静态信息数据与新生“梦拓组队”的动态行为数据进行集成分析,归纳出新生整体性的心理特征和实际需求,从而为新生适应性教育工作提出科学化建议。   二、 研究内容   (一) “梦拓计划”及信息平台。北京航空航天大学基于“朋辈教育”的理念,在新生入学后实行“梦拓计划”:选拔优秀的二年级本科生作为“Mentor”,通过开展文化体验课等交流活动帮助一年级新生更好地适应大学生活,以达到开拓视野、提高素养、共同进步的目标。为支撑“梦拓计划”顺利实施,改变传统的“指派式”的学生工作模式,我们研发了“梦拓”信息平台,新生可根据自己的兴趣点和实际需求在平台中自由选择“Mentor”。数据层记录学生“Mentor组队”过程中的行为数据,用以分析学生总体特征和每个人的个性特征图谱。目前该平台已经应用到北京航空航天大学计算机学院、软件学院、知行书院、宇航学院四个单位,共采集1039人的静态信息数据和动态行为数据。   (二) “Mentor”特征向量提取。本文对数据库中“Mentor”简介进行特征标签标注(与后台日志时间戳一一映射),采用分词系统进行分词处理并得到163个代表“Mentor”特征的离散关键词,并利用LDA模型[1]对关键词进行特征分析。   利用LDA模型对163个关键词进行特征分析,通过对比后台日志时间戳对参数进行调优,最终聚类出最受新生关注的七大“Mentor”特征,构成“Mentor”七维核心特征优势向量,每个分量代表着“Mentor”可能具备的特征项。本文将“Mentor”特征向量表示如下:   [文艺,体育,学习,工作,专业(技术),休闲,社交]   基于聚类得到的样本数据,本文进一步统计得到七维核心特征优势向量占比(即拥有某个分量特征的人占总人数的百分比)分别为[9.71%, 8.01%, 8.98%, 13.83%, 10.68%, 3.40%, 20.87%],占比排序为[4,6,5,2,3,7,1]。   分析分量占比数据,可以看出新生对“Mentor”特征的倾向:新生群体整体偏向选择外向交友型和工作能力突出型的学长学姐作为自己的“Mentor”,具备较强专业能力特征的“Mentor”占比也比较高;另一方面,本文结合北航实际情况将“Mentor”性别作为一个特殊的影响因子加入到研究中,并发现“女性Mentor”在实际组队过程中非常受欢迎,这在一定程度上影响了一般情况下的组队行为,可能与北航男女比例的特殊性有一定关系。   (三) 新生动态行为数据处理模型构建。本文在研究过程中,采用北航“梦拓”信息平台数据库中已记录的用户操作时间戳、相关操作日志以及网页访问日志共计2万余条操作数据,涵盖了新生访问平台的各类操作以及对于数据库访问的慢日志统计下的选择信息。基于以上行为数据,利用数据扫描处理工具Scanner对大量日志文本数据进行扫描处理,去除噪声数据(例如管理员操作的数据等)后对有效区间内的数据进行处理。在此基础上,本文根据降温原理构建分量热度模型,利用数据拟合方法进行数据分析,期望得到新生所选“Mentor”的每个特征分量热度值并排序,以更科学地挖掘学生的行为特性和兴趣关注点。   现将分量热度模型描述如下:   时间刻度:以组队时间的开始和结束为界,对时间线进行均分后得到若干具有一定粒度的时间段;为每个时间段赋予的时间标识值,即为时间刻度值;   热度权重:即每个阶段的热度的量化的衡量值。(本文中最高热度定为100,最低热度定为0,可以用操作数归一化到0-100)。   现将采用的公式描述如下:   总体热度公式:   W=K*(A*T2+B*T+C)   其中,W表示热度权重,K表示归一化系数,T表示时间刻度,C为常数。所示时间段(242-258)参数分别为:K=5.46,A=0.0528,B=-27.123,C=3489.90。   某向量分量的热度值可用该分量在该刻度下被选择数量与热度权重之积的累加和表示:   H=∑(N*W)   其中,H表示分量热度值,N表示分量数目,W表示分量热度权重。   (四) 综合量化分析。由于七维核心

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档