[管理学]ch02y11数据挖掘理论与应用.ppt

[管理学]ch02y11数据挖掘理论与应用

yes no yes no yes no yes no outlook sunny 2/9 3/5 Temperature hot 2/9 2/5 humidity high 3/9 4/5 windy true 3/9 3/5 overcast 4/9 0/5 mild 4/9 2/5 normal 6/9 1/5 false 6/9 2/5 rainy 3/9 2/5 cool 3/9 1/5 天气数据统计 X = rain, hot, high, false P(X|p)·P(p) = P(rain|p)·P(hot|p)·P(high|p)·P(false|p)·P(p) = 3/9·2/9·3/9·6/9·9/14 = 0.010582 P(X|n)·P(n) = P(rain|n)·P(hot|n)·P(high|n)·P(false|n)·P(n) = 2/5·2/5·4/5·2/5·5/14 = 0.018286 样本 X 通过类 n (don’t play)来分类 分类 X 从理论上讲与其它分类器相比,贝叶斯分类器具有最小的错误率。但实际上由于其所依据的类别独立性假设和缺乏某些数据的准确概率分布,从而使得贝叶斯分类器预测准确率受到影响。但各种研究结果表明:与决策树和神经网络分类器相比,贝叶斯分类器在某些情况下具有更好的分类效果。它适合用在预测

文档评论(0)

1亿VIP精品文档

相关文档