- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验2 贝叶斯分类判别法
实验原理
实验数据:IRIS数据。分为三种类型,每种类型中包括50个思维的向量。
实验模型:假设IRIS数据是正态分布的。
实验准备:在每种类型中,选择部分向量作为训练样本,估计未知的均值和方差的参数。
实验方法:最小错误判别准则;最小风险判别准则。
实验原理:
贝叶斯公式
已知共有类别,统计分布为正态分布,已知先验概率及类条件概率密度函数,对于待测样品,贝叶斯公式可以计算出该样品分属各类别的概率,叫做后验概率;看属于哪个类的可能性最大,就把归于可能性最大的那个类,后验概率即为识别对象归属的依据。贝叶斯公式为
该公式体现了先验概率、类条件概率、后验概率三者的关系。
其中,类条件概率密度函数为正态密度函数,用大量样本对其中未知参数进行估计,多维正态密度函数为
式中,为n维向量;
为n维均值向量;
为n维协方差矩阵;
是的逆矩阵;
是的行列式。
大多数情况下,类条件密度可以采用多维变量的正态密度函数来模拟。
为类的均值向量。
最小错误判别准则
两类问题
有两种形式,似然比形式:
其中,为似然比,为似然比阈值。
对数形式:
多类问题
本实验采取针对多累问题的解决方法。在待测向量的条件下,看哪个类的概率最大,应该把归于概率最大的那个类。因此,可以通过比较各个判别函数来确定的类型。
对数形式为:
所以此时正态分布的贝叶斯分类器判别函数为
最小风险判别准则
对观测值条件下,各状态后验概率求加权和的方式,表示风险如下:
其中,为将第j类判为第i类的损失。若判对i=j,则取负值或零值,表示没有损失;若判对ij,则取正值,数值大小表示损失多少。
对得到的M个类型的风险值进行比较,得到使条件风险最小的类别,判别X属于该类别。
实验过程
实验环境:MATLAB R2009a
将txt格式下的IRIS数据导入实验环境中。实验中设计了对话框,可直接选择存放该文件的路径并导入。
将读入的数据进行逐行录入,按行录入在1*150的数组iris中,每一个元素中包含一个四维向量。
通过计算,分别估计出三类的统计特征值,即正态分布的两个重要参数均值和方差。,。以下程序段为第一类特征值求取过程,第二、三类相似,实验中,取第偶数个向量为训练样本。
已经估计出三类数据的统计特征。首先使用最小错误判别准则进行分类,实验中采用对数形式计算,假设三种类型的先验概率相等,即均为1/3,在某一X下得到的三个后验概率的函数。比较三个值的大小,哪个最大,就可判断X属于哪一类。最后进行了分类器判据结果的验证。
5.再使用最小风险判别准则进行分类,实验中扔采用对数形式计算,假设三种类型的先验概率相等,即均为1/3。设计出风险参数矩阵L,该数据可根据实际损失的情况需要进行修改。将X代入得到三个数值,哪个最小,即为风险最小,便属于该类型。最后同样进行了判别结构的验证。
实验结果与分析
最小错误判别准则
判断第1个数据属于第1类
判断第2个数据属于第1类
判断第3个数据属于第1类
判断第4个数据属于第1类
判断第5个数据属于第1类
判断第6个数据属于第1类
判断第7个数据属于第1类
判断第8个数据属于第1类
判断第9个数据属于第1类
判断第10个数据属于第1类
判断第11个数据属于第1类
判断第12个数据属于第1类
判断第13个数据属于第1类
判断第14个数据属于第1类
判断第15个数据属于第1类
判断第16个数据属于第1类
判断第17个数据属于第1类
判断第18个数据属于第1类
判断第19个数据属于第1类
判断第20个数据属于第1类
判断第21个数据属于第1类
判断第22个数据属于第1类
判断第23个数据属于第1类
判断第24个数据属于第1类
判断第25个数据属于第1类
判断第26个数据属于第1类
判断第27个数据属于第1类
判断第28个数据属于第1类
判断第29个数据属于第1类
判断第30个数据属于第1类
判断第31个数据属于第1类
判断第32个数据属于第1类
判断第33个数据属于第1类
判断第34个数据属于第1类
判断第35个数据属于第1类
判断第36个数据属于第1类
判断第37个数据属于第1类
判断第38个数据属于第1类
判断第39个数据属于第1类
判断第40个数据属于第1类
判断第41个数据属于第1类
判断第42个数据属于第1类
判断第43个数据属于第1类
判断第44个数据属于第1类
判断第45个数据属于第1类
判断第46个数据属于第1类
判断第47个数据属于第1类
判断第48个数据属于第1类
判断第49个数据属于第1类
判断第50个数据属于第1类
判断第51个数据属于第2类
判断第52个数据属于第2类
判断第5
原创力文档


文档评论(0)