- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在中职教学质量评估中应用
数据挖掘技术在中职教学质量评估中应用
【摘要】实现教育教学过程中对教师教学水平公正、准确、快速地评价,是学校实施现代化教学管理的重要前提,传统的教学评价方法存在着主观性大、精准度差操作复杂等问题。本文提出了基于支持向量机的数据挖掘算法与学校教师的评价指标相结合的改进方案,利用SVM对样本数据进行分类,通过在评价系统中对样本数据的训练形成训练模型,并进一步利用该模型完成对预测数据的职能分析和评测。实验证明,同传统方法相比,方案具有综合性能优势及应用价值。
【关键词】教学评价SVM惩罚因子核函数
【中图分类号】G71 【文献标识码】A 【文章编号】2095-3089(2014)03-0024-02
教育教学系统的评估已经成为了国内外学者的研究热点。针对教师综合教学的评价体系有了快速发展,而目前大多的研究主要基于传统的数据统计方法,复杂的评估参数及繁重的计算方法无法满足当今科学测量、评价的发展需求。支持向量机通过把非线性分类问题转换成线性分类问题,较好解决了传统算法中训练集误差最小而测试集误差仍较大的问题,且算法具有较高的效率和精度,目前在分类和回归模型中被广泛应用。提出一种基于SVM的教学评价模型,充分利用机器学习方法的分类优势,训练SVM智能、准确反映教师的教学水平。
1.SVM学习算法
SVM从线性可分情况下的最优分类面发展而来:假设训练样本输入为xi(i = 1,2,……n),期望输出yi∈{+1,-1},超平面ωxi+b =0需满足约束条件yi(ωxi+b)-1≥0)以实现样本的正确分类。使最大化分类间隔2/||ω||获得最小值的分类面即为最优分类面,满足|(ωxi)+b|=1的样本点为支持向量。对于非线性的情况,可以将非线性变化转化为另一个高维特征空间的线性问题,然后在这个高维空间中求最优分类面,其分类函数为f(x)=sgn(ωx+b)=sgn(■a■■yiK(xix)+b■■)。
表1 精确度随γ值的变化情况表
2.基于数据挖掘技术的教学评价
2.1评价系统指标标准化
教学系统评价为多层次、多指标的问题[3,4],本文建立了12个评价指标,即每个样本数据的特征向量共有12个属性。281个样本数据来自于对教师教学质量的随机调查评分,并分为3个等级。按SVM指定格式对各指标进行归一化处理,使数据范围为[-1,1]。选取200个数据作为训练样本,其余作测试样本,然后调用SVM分类器进行评价。标准化过程如下:
Function normal = normalization(x, kind)
if margin 2
Kind = 2;% kind = 1 or 2 for the first class or second class of normalized
End
[m,n] = size(x);
Normal = zeros (m, n);
%% normalize the data x to [0,1]
if kind == 1
for i = 1:m
ma = max( x(i,:) );
mi = min( x(i,:) )
normal(i,:) = ( x(i,:)-mi )./( ma-mi );
end
end
2.2核函数选择与参数确定
图1给出了3种核函数在相同γ值条件下,精确度随C值变化的对比曲线。随着C值的增加3种核函数的精确度随之增长,然而当惩罚因子到达某一特定值时,算法精准度增加缓慢或出现停滞,因此最终确定实验中的核函数为RBF,惩罚因子C=27。γ是影响精确度的重要参数,表1中的实验结果显示精确度在γ∈[0.01,0.09]时,随着γ值的连续增长有所提高,在γ=0.0833(1/n)时获得最大值94.3529%。
2.3基于SVM的训练
提取数据库中其余的样本数据,采用SVM Predict对训练结果进行验证以获得较好的匹配比率。实现代码如下:
load training_scale;
data = training_scale_inst;
label = training_scale_label;
% Build classification model
model = svmtrain (label, data,
文档评论(0)