分类基本概念和方法.pptVIP

  • 7
  • 0
  • 约6.53千字
  • 约 28页
  • 2016-06-05 发布于天津
  • 举报
分类基本概念和方法

数据挖据技术 (Data Mining) 王磊 (副教授) 经济信息工程学院 朴素Bayes分类 例子 分类器评价指标: Precision and Recall, and F-measures 调和方法: F measure (F1 or F-score):精度和召回的调和平均值, F?:精确度和召回率的加权量 assigns ? times as much weight to recall as to precision ROC曲线 接收者操作特征曲线(receiver operating characteristic curve,或者叫ROC曲线) ,用于比较不同模型的优劣。 例子: ROC曲线 通过改变二元分类模型的阈值,可得出不同的FPR和TPR组合,连接多个点从而获得曲线。 还有一些分类器模型的预测结果可以以概率形式给出,如svm,从而容易设置阈值,改变预测结果。 如何评价优劣 ROC曲线下方面积(Area under the Curve of ROC , AUC) AUC值越大的分类器,正确率越高。 从AUC判断分类器(预测模型)优劣的标准: AUC = 1,是完美分类器,采用这个预测模型时,存在至少一个阈值能得出完美预测。绝大多数预测的场合,不存在完美分类器。 0.5 AUC 1,优于随机猜测。这个分类器(模型)妥善设定阈

文档评论(0)

1亿VIP精品文档

相关文档