- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则挖掘学生评教结果分析
基于关联规则挖掘学生评教结果分析
摘 要:利用Apriori算法对1355个课堂的学生评教结果进行了关联规则挖掘。挖掘结果表明学生对具有硕士学位职称为正高级年龄超过46岁的教师的教学效果评价较差,对具有副高级职称年龄在35岁及以下的教师的教学效果评价较好。本文据此提出了相应的教学建议。
关键词:学生评教;教师特征;关联规则
0 引言
随着我国高校信息化水平的不断提高,几乎所有高校的教务管理或教学质量监控部门都引入学生评教系统并开展了学生评教工作,积累了大量的学生评教数据。一些高校的教学管理人员已经意识到了学生评教数据中蕴含着对提高教学质量有用的潜在信息和知识,并逐步着手开展了对学生评教数据的分析与挖掘。其中,将数据挖掘中的关联规则挖掘技术应用到学生评教数据以发现教师背景特征与学生评教得分之间的内在联系是一个研究热点。如周秀梅、李高菊等通过关联分析发现教师的职称和年龄会影响教学效果,教师的学历和性别对评教结果的综合分数无显著影响[1-2]。张美华等通过对300份数据进行关联挖掘发现30-40岁之间具有中级职称的教师容易被学生接受,?W生对初级职称教师反映问题较多[3]。杨钧的关联规则挖掘结果表明,专业技术职务为正教授的教师平均得分最高,副教授和讲师平均得分相差不多[4]。张砚雪利用分层次法关联挖掘对教师测评系统数据库中的数据进行分析发现,具有副高职称的教师,学生评价分数很高,助教职称的教师则没有得到学生的认可[5]。
然而,通过对大量的文献分析发现,目前研究人员在使用关联规则挖掘学生评教数据时基本上只考虑了规则的有效性,对规则实用性的关注不够。另外,所使用的数据来自于部分学院甚至个别专业的少量数据,数据的代表性和证明力略显单薄。本文利用Apriori算法对某部属高校学生评教的真实数据进行挖掘,找出高校教师自身特征与学生评教结果之间的关联规则,以期为培养高素质的高校教师队伍进而提升高校教学质量提供实证研究依据。
1 数据来源及预处理
本研究所需要的数据包括学生评教数据和教师自身特征基础数据。学生评教数据来自于某部属高校2014-2015学年度第2学期学生评教数据库中的原始数据,教师自身特征数据来自于该校人事管理系统的基础数据库。
学生评教数据在使用之前进行了数据筛选、课堂评教平均得分计算和离散化、缺失值和异常值去除等预处理,共得到1399个课堂评教数据。其中缺失值是由于部分学生未对所修课程所有评分指标进行评分造成的。异常值包括因学生恶意差评[6]导致总分少于40分的学生数据记录和评教人数少于10人的课堂记录。评教得分离散处理时将全校所有课堂按最终平均得分排名,前三分之一为优等级,中间三分之一为中等级,后三分之一为差等级。
教师自身特征数据经过数据筛选、专业技术职务名称统一和年龄离散化等处理,共得到1490位教师数据。其中原始数据中的教授和正高级统一为正高级职称,副教授和其他副高级统一为副高级职称,讲师和其它中级统一为中级职称,助教和其它初级统一为初级职称。年龄的离散化处理将年龄为36岁以下的教师归为青年教师,36-46岁之间为中年教师,46岁以为老年教师。
最后,将学生评教数据和教师自身特征基础数据按教师工号连接合并。因部分外聘教师信息登记不全,连接后的数据中有44个课堂的教师基本信息存在缺失值,去除后剩余1355条记录为本研究最终使用数据,结构如表1所示。
2 研究方法及工具
关联规则挖掘用于发现数据项之间的密切程度或关系,对于给定的项和事务集,通过对事务集的分析,挖掘出项集中项之间的相关性。挖掘出的结果通常以规则的形式描述,称为关联规则。关联规则的一般表示形式为X→Y。其中X称为规则的前(左)项,可以是一个项或项集。Y称为规则的后(右)项,一般为一个项,表示某种结论或事实。
一般情况下,可以从数据中找到很多关联规则,但并不是所有的关联规则都有效且实用。必须采用一定的测度指标筛选出有效且实用的关联规则,这些规则称为强关联规则。强关联规则常用的测度指标包括支持度(support)、可信度(confidence)和提升度(lift)。
支持度用于测度关联规则应用的普适性,其值为前项与后项同时出现的概率,数学公式如式(1)所示,式中|T|表示事务总数。
可信度用于测度关联规则的准确性,其值为包含前项的事务中同时也包含后项的概率,反映出前项出现的条件下后项出现的可能性,数学公式如式(2)所示,式中|T(X)|表示包含项X的事务数,|T(X∩Y)|表示同时包含项X和项Y的事务数。置信度高说明前项出现时后项出现的可能性高。
置信度和支持度用于测度规则的有效性,即那些具有较高置信度和较高支持度的规则才被认为是有效的规则。实际挖掘过程中,通常需要根
原创力文档


文档评论(0)