第七章26课件讲解.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第七章;单击此处

添加章节标题;;;;;;;;高斯分布就是正态分布,高斯朴素贝叶斯就是先验为高斯分布的朴素贝叶斯。

我们把一个随机变量X服从数学期望为μ、方差为σ2的数据分布称为正态分布,当数学期望μ=0,方差σ=1时称为标准正态分布。如下图所示:;高斯朴素贝叶斯原理

现有一人,名叫李四,李四对观看了《流浪地球》这部电影某场次的观众做了调查,将观众分为两类,喜欢《流浪地球》这部电影的和不喜欢《流浪地球》这部电影的。这两类观众的人数相等。

由于两类观众的人数相等,所以两类观众的先验概率均为0.5,即P(喜欢)=P(不喜欢)=0.5。

现对食用了50g爆米花、500ml苏打水和25g糖果的观众进行预测分类。;;;同理:提取不喜欢《流浪地球》的观众零食和饮料数据的似然分布中3个条件对应的似然值,不喜欢《流浪地球》的观众零食和饮料数据对应的概率计算,不喜欢《流浪地球》的观众对应的概率约为-48。

由于概率值-48大于-124,所以认为食用了50g爆米花、500ml苏打水和25g糖的观众不喜欢《流浪地球》的可能性大于喜欢《流浪地球》的。

上述李四对观众类别进行分类预测的思路方法为高斯朴素贝叶斯的算法原理。;scikit-learn库中的naive_bayes模块提供了GaussianNB类作为高斯朴素贝叶斯模型。基本定义如下:

classsklearn.naive_bayes.GaussianNB(priors=None,var_smoothing=1e-09)

参数说明如下:

priors:表示类的先验概率,对应Y的各个类别的先验概率P(Y=Ck)。这个值默认不给定,如果没有给定,模型则根据样本数据自己计算;如果给出的话就以priors为准。

var_smoothing:浮点数,可不填(默认值=1e-9)。在估计方差时,为了追求估计的稳定性,将所有特征的方差中最大的方差以某个比例添加到估计的方差中,这个比例由var_smoothing参数控制。

GaussianNB类的拟合、预测方法与BernoulliNB类一样,这里就不再描述了。;;;;THANKSFORYOURWATCHING

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档