- 1、本文档共8页,其中可免费阅读3页,需付费100金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Python贝叶斯文本分类模型从原理到实现
朴素贝叶斯分类器是一种有监督学习,常见有两种模型,多项式模型(multinomial model)
即为词频型和伯努利模型(Bernoulli model)即文档型。二者的计算粒度不一样,多项式模型
以单词为粒度,伯努利模型以文件为粒度,因此二者的先验概率和类条件概率的计算方法都
不同。计算后验概率时,对于一个文档d,多项式模型中,只有在d 中出现过的单词,才会
参与后验概率计算,伯努利模型中,没有在d 中出现,但是在全局单词表中出现的单词,也
会参与计算,不过是作为“反方”参与的(避免消除测试文
文档评论(0)