地方本科高校计算机类毕业生就业问题研究.docxVIP

地方本科高校计算机类毕业生就业问题研究.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
地方本科高校计算机类毕业生就业问题研究 摘要:通过收集、整理和预处理,获得较为完整的计算机类毕业生信息数据;分析专业、性别、社会实践与政治理想、获取精准扶贫助学金、违规违纪处分、毕业情况等各种因素对学业的影响,进而得到地方本科高校计算机学科教学管理的若干有意义的指导与建议,为学生在校期间的学业做出预测性的评估与预警。 一、问题的提出 随着我国工业2025和智能制造战略的提出,以及信息产业“自主可控”的现实意义越来越迫切,高素质信息技术人才成为左右国家政治命脉、经济发展、军事强弱和文化复兴的关键因素。覆盖了互联网、软件开发、硬件设计、云计算、大数据、人工智能等相关专业的计算机教育近年来得到了快速发展。据统计,目前我国也有1200个院校开设了计算机类相关本科专业,其中,“985”“211”院校占15%左右,地方本科院校占85%左右 此外,学生在校期间的学业受多种因素的影响 二、分析研究方法 数据分析与数据挖掘成为进行复杂问题分析的重要方法,通过对客观真实的数据进行分析,不仅能对预设问题进行合理解释,也能发现隐藏的新问题。数据分析与数据挖掘方法在教育领域得到了广泛应用 本文通过对获取我院2020届计算机类专业毕业学生的学业进展数据、党员发展数据、毕业认证数据、精准扶贫奖学金数据、班级班干成员数据等进行数据集成,然后利用SPSS软件对数据信息综合分析 三、数据准备 数据准备(数据预处理)是数据分析的前提,合理的、高质量的样本信息是分析结果准确、有效的保证。在数据预处理中,综合使用了多种手段和工具,如C语言、Access数据库、SPSS、扫描仪、文字识别软件等。数据预处理的基本过程如图1所示。 (一)数据抽取 分析研究涉及到2020届毕业生的学业进展、党员发展、毕业认证、精准扶贫奖学金、班级班干成员等数据,这些数据来源于不同的系统和渠道、以多种文件格式(包括数据库表、Excel、CSV、文本文档、数据图片、纸质文档等)存储。数据抽取时,将不同渠道获取的数据均以毕业生的“学生编号”作为标识属性存储在不同的数据表中,并存入用于数据初步处理的Access数据库中。 在上述过程中,处理的难点在于非机构化存储的文本文档、图片和纸质文档,本文采用的处理方法如下: 1. 对于非结构化存储的文本文件,编写字符过滤程序对数据进行格式化。 (二)数据集成 通过数据抽取,将不同渠道信息存储在Access的不同数据表中,并经过简单的处理及分析。然后,将Access中的数据表导入SPSS分析软件,利用“变量合并”功能将多个表中的信息根据“学生编号”标识进行数据合并;合理设计合并后数据表中的变量属性:数据类型、宽度、小数点位数、标签、值、度量标准、角色等,最后以SPSS支持的“sav”格式保存数据;通过数据的规范化,便于后续在SPSS中进行数据分析。 (三)数据编码 集成后的sav数据表中仍然存在数据编码不准确的问题,问题主要分为两类: 1. 变量冗余。 例如“毕业”与“结业”预设成为了两个变量,可以合并为“毕业类型”变量,并设置值为:1-毕业、2-结业。 2. 变量取值不规范。 例如“处分情况”变量中,存在的取值包括:“否”“无”“没有”“有”“是”等,必须通过变量编码,将取值规范为:“否”和“是”。 同时,对需要进行区间与频数进行分析的字段,创建新的变量。 (四)空值与异常值处理 集成的sav数据表中,部分变量存在空值,虽然空值可能会导致某些分析算法的效果变差,但是空值也存在着一定的意义(比如某些课程没有成绩,是否意味着相应学生并没有选修这门课程);通过调查研究空值产生的原因,在保留原空值的数据表的基础上,利用SPSS的缺失值分析及变量计算方法,新建一个不存在空值的数据表,便于在后续的分析中使用。 针对少数异常值,主要调查产生的因素,尽量予以保留,以便发现新的问题与解析结果。 经过预处理后,最终数据表的变量信息说明,如表1所示。 除表1中所示的重要变量信息之外,2020计算机类毕业生信息表的变量还包含:专业必修课、专业选修课、公共课、素质选项课、实践环节等。最终,2020计算机类毕业生信息表包含245个样本,40个变量。 四、数据信息分析 数据准备完成后,即可针对前面提出的问题进行分析。数据分析包括:确定具体的分析目标、确定学业评价主要变量、数据分析结果与结论等阶段。 (一)分析目标 本数据分析的目的,是希望发现地方本科高校计算机类专业影响学生学业情况相关因素,通过相关结论,以指导相关专业学生在校学习、对生活学习情况进行预警;同时,为完善人才培养方案、完善课程开始内容改革、学习结果评价改革给出一定的建议。具体的分析目标如下: 1. 不同专业学生学业情况分析。 2. 不同性别学生学业情况分析。

文档评论(0)

lgjllzx + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档