基于大数据的高校学风建设的分析与研究.docxVIP

下载本文档

1
0
约5.58千字
约 6页
2022-09-11 发布于陕西
举报
版权申诉

基于大数据的高校学风建设的分析与研究.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于大数据的高校学风建设的分析与研究　　摘要：高校的学风建设是高校办学目标中的重点建设对象，是体现高校办学质量的重要所在。这篇文章正以北京信息科技大学的学风基础数据为例，从不同维度对基础数据进行统计分析、计算及比较，发现和挖掘影响学风建设的各种因素，提出有利于学风建设的建议。　　关键词：大数据;学风建设;关联分析　　中图分类号：g641文献标识码：a文章编号：1007-9416（2019）11-0188-04 　　0引言　　近年来，随着“大数据”成为互联网信息技术行业的流行词汇，教育逐渐被认为是大数据可以大有作为的一个重要应用领域。利用大数据对学生的数据进行分析，挖掘，可以得出有利于高校学风建设的信息与知识，探索加强和改进学风建设的有效途径，为高校教学提供决策，推进教育教学改革，提高学生的教育培养质量。此外，优良学风是进行教育改革的前提条件，加强学风建设更是教育改革深入进行的需要，但当前高校学风建设仍存在很多问题。　　首先是理想和现实的落差，一些学生由于盲目报考专业以及入校后专业选择上的限制，使许多学生往往学非所愿、学非所长，这些使他们消极苦闷、缺乏学习动力。其次是不能尽快适应大学的环境和学习方式。部分学生不能够尽快适应从高中到大学的角色转变，不知如何合理规划自己的生活，从而影响学习。再者是缺乏持之以恒、勤奋刻苦的学习精神，脱离了家长和老师束缚的大学生难免会放松对自己的要求。最后是学习目的不明确，学习态度不端正，功利性太强。有些学生缺乏人生目标和理想信念，对自己的大学生活没有合理的规划，没有明确的学习目的，导致学习动力不足，与他人差距越来越大。　　本项目主要是以本学校数据为主，在了解其他学校数据的基础上，对学生的一些数据进行分析、挖掘得出结论，提出一些加强和改进高校学风建设的指导意见，为高素质人才培养打好基础，促进高校人才培养的特色建设、品牌建设，以及人才培养质量的不断提升。　　1高校学风数据的获取与预处理　　1.1影响因素的确定　　学风建设是一所学校发展的重中之重，基于当前大学生的学风问题，我们构建了科学、全面、合理的评价模型，遵循科学性、导向性、全面性、可行性、发展性等原则，确定了评价体系的各个指标要素：学校排名情况、出勤率、人均学习时间、图书馆借阅情况、参加社团情况。　　1.2数据采集　　我们通过进入各大高校调研、对同学们发放调查问卷以及向相关老师获取数据等方法进行数据的采集，对于采集不到足够数据的情况，我们随机抽取现有数据进行复制，获得足够大的数据量，保证结果的准确度，我们发出问卷1800份，实际有效问卷1748份，此外我们还利用python作为处理工具，收集到了各大高校的排名情况。　　1.3数据清洗　　本项目的预处理选择python作为数据处理工具，首先查看元数据即调查问卷中我们所收集到的信息，另外是随机抽取一部分的数据，通过人工查看的方式，对数据本身做一个比较直观的了解，并且初步发现一些问题，为之后的数据做准备。　　其次抽取部分数据进行删除错误字段来构建模型，模型效果达到预期效果后，再在整体数据中进行删除错误字段的操作，以免效果不理想对数据进行损坏出现误差。　　然后进行对异常值的处理，通过各项频数分析判断是否存在异常值，当项目发现存在异常值之后，项目对各项数据分别求出其标准差，设定与平均值的偏差超过三倍标准差的值为异常值，对于检测出来的异常值，项目采用了填补法，即处理掉异常值并在相应位置随机填补平均值、中位数或众数。　　最后项目根据各个学校的综合情况，将所有学校分成三组，如表1为数据清洗部分结果。　　2数据关联分析及可视化　　2.1关联分析法　　因为本项目中有多个因素，关联分析能更好的分析各个因素之间的关系，作出对数据中变量之间关系的最佳解释，本项目计算了支持度，置信度，提升度，确信度。计算支持度的意义在于，预判这条规则是否值得继续挖掘，支持度越高，这些项出现的越频繁，这暗示了他们可能蕴藏着的值得挖掘并利用的关联规则;置信度反映了這条规则的可靠程度，但是置信度存在一个盲点，就是没有考虑到规则后继单独发生的概率，所以，本项目又选择了提升度，提升度越高，这条关联规则越有潜在意义，一般情况下使用支持度，置信度，提升度作为参考，当然也会参照确信度。　　2.2apriori算法　　由于apriori算法原理简单，容易被人理解，易于并行化，对大数据有优势，而且算法结果可以在实践中直接使用，因此项目采取了apriori算法进行关联分析。　　（1）构建模型。　　1）发现频繁项集。　　①找