02性能评价数据的采集和组织.pptVIP

  • 1
  • 0
  • 约2.33千字
  • 约 28页
  • 2016-12-05 发布于重庆
  • 举报
02性能评价数据的采集和组织

生物医学数据挖掘 Biomedical Data Mining 回顾 第一章 概论 四、数据挖掘性能评价 评价准则:结果或模型 准确性 可理解性 性能 数据的噪声 四、数据挖掘性能评价 样本的组织 所有样本属性已知 两类样本:相互独立 学习样本/训练样本集:规律的总结 测试样本集:评价、检验 两类样本的分组 两类样本的分组 随机分组法: 通常:训练集(2/3),测试集(1/3) 两类样本的分组 交叉验证法: 如 K折交叉验证法(一般随机分成10组) 留一法:适用样本数据更少的情况 举例 四、数据挖掘性能评价 预测型模型的性能评价 残差 混淆矩阵 P10 灵敏度(sensitivity) 特异度(specificity) 分类正确率(accuracy) ROC(receiver operating characteristics curve)曲线 四、数据挖掘性能评价 灵敏度 特异度 分类正确率 灵敏度与特异度 取值:均在0-1之间 缺点:单独使用,可能出现矛盾 解决办法:ROC曲线 四、数据挖掘性能评价 ROC曲线 灵敏度与特异度间的平衡(trade off) 总结 第二章 数据采集与准备 一、数据的采集和组织 一、数据的采集和组织 一、数据的采集和组织 一、数据的采集和组织 上海交通大学医学院 计算机应用教研室 龚著琳 第

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档