网站大量收购独家精品文档,联系QQ:2885784924

SPSSAU_机器学习_朴素贝叶斯.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

SPSSAU-在线SPSS分析软件

K近邻算法KNNk-nearestneighborSPSSAU

朴素贝叶斯模型

Contents

1背景2

2理论2

3操作3

4SPSSAU输出结果3

5文字分析4

6剖析5

贝叶斯模型是利用先贝叶斯定理进行计算的一种机器学习模型,并且此处涉及先验概率和

后验概率。比如我们都知道去赌场会十赌九输,此是以前的经验,即为先验概率,也或者大家

都知道抛硬币时上下面第一次都是1/2概率,这均为先验概率;如果发现一个人准备跳楼,那

么此时他是因为赌博导致的概率是多少?此为后验概率。有了先验概率和后验证概率理解,结

合贝叶斯定量即可计算出概率信息值。

接着,朴素贝叶斯是基于贝叶斯定量,并且加上条件(特征之间独立)的一种模型。此处

特征属性之间独立是指比如:有100个数据,第1行数据与第2行,第3行等其它任意行数据

之间并没有关系,此前提条件非常重要,但现实中较难成立,但这并没有妨碍其的广泛使用,

可能原因在于朴素贝叶斯模型通于分类问题处理,其内部算法上会关注于条件概率排序并非具

体概率数字,因而其具有一定容错能力,并且特征属性之间假如有着关系并不完全独立,其内

部可能存在相关抵消现象。整体上看,朴素贝叶斯模型原理较为简单,且应用较为广泛,比如

输入法时可能会进行纠错功能处理,也或者垃圾邮件的识别等。

SPSSAU-在线SPSS分析软件

朴素贝叶斯模型案例

Contents

1背景2

2理论2

3操作3

4SPSSAU输出结果3

5文字分析4

6剖析5

1背景

案例数据依旧采用‘鸢尾花分类数据集’,其数据集为150个样本,包括4个特征属性(4个

自变量X),标签为鸢尾花卉类别,其分为3个类别分别是刚毛鸢尾花、变色鸢尾花和弗吉尼亚

鸢尾花(下称A、B、C三类)。

2理论

朴素贝叶斯模型的原理较为简单,其利用贝叶斯概率公式,分别如下:

()(∣)

(∣)=

()

接着假定各特征属性独立,并且将公式进行展示成如下:

()∏(∣)

=1

(∣,,⋯ ,)=

12∏()

=1

关于朴素贝叶斯模型时,其原理理解较为简单,但其内部算法上有着更多内容,感兴趣的

读者可参阅下述页面,点击查看。

/stable/modules/naive_bayes.html

关于朴素贝叶斯参数上,其特征(自变量X)的数据分布对模型有着较大影响,如下表格

说明:

参数说明参数值设置

特征分布类特征项(自变量X)的高斯分布:默认,大多数分布都是高斯分布。

文档评论(0)

147****4623 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档