两类正态分布模式的贝叶斯判别.docVIP

下载本文档

111
0
约4.78千字
约 7页
2019-01-22 发布于广东
举报
版权申诉

两类正态分布模式的贝叶斯判别.doc

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE PAGE 7 两类正态分布模式的贝叶斯判别硕633 3106036072 赵杜娟一.实验目的 1．理解贝叶斯判别原则，编写两类正态分布模式的贝叶斯分类程序； 2．了解正态分布模式的贝叶斯分类判别函数； 3．通过实验，统计贝叶斯判别的正确率。二.实验原理（1）贝叶斯判别原则对于两类模式集的分类，就是要确定x是属于类还是类，这要看x来自类的概率大还是来自类的概率大，根据概率的判别规则，可以得到：如果则如果则（1.1）利用贝叶斯定理，可得式中，亦称似然函数。把该式代入（1.1）式，判别规则可表示为：则则或写成：则则（1.2）这里，称为似然比，称为似然比的判决阈值。该式称为贝叶斯判别。（2）正态分布模式的贝叶斯分类器判别原理具有M种模式类别的多变量正态分布的概率密度函数为：（1.3）式中，是维列向量；是维均值向量；是协方差矩阵；为矩阵的行列式。且有；；表示对类别属于的模式作数学期望运算。可见，均值向量由n个分量组成，协方差矩阵由于其对称性故其独立元素只有个，所以多元正态密度函数完全由个独立元素所确定。取自一个正态总体的样本模式的分布是聚集于一个集群之内，其中心决定于均值向量，而其分布形状决定于其协方差矩阵，分布的等密度点的轨迹为超椭圆，椭圆的主轴与协方差矩阵的本征向量的方向一致，主轴的长度与相应的协方差矩阵的本征值成正比。类别的判别函数可表示为：对于正态密度函数，可对判别函数取自然对数，即：将（1.3）代入上式，简化后可以得到：这是正态分布模式的贝叶斯判别函数。显然，上式表明是超二次曲面，所以对于两类正态分布模式的贝叶斯分类器，两个模式类别之间用一个二次判别界面分开，就可以求得最优的分类效果。对于两类问题，判别界面方程为：即：判别条件为：如果，则如果，则应指出，贝叶斯分类规则是基于统计的概念，因此要有大量的模式样本，才能获得最优的结果。三实验内容及结果分析 1.根据实验要求，在本实验中将三组分别服从不同参数的正态分布数据两两进行分类，利用贝叶斯原理首先设定其先验概率，并从每组数据中随机抽取一定的训练样本数来进行参数估计，从而得到三组数据各自的条件概率。 2.根据条件概率，利用贝叶斯判别原则进行分类实验，得到结果。 3.实验结果分析分别对x1，x2和x3两两进行实验，每次选取不同的先验概率和不同的训练样本数，进行训练，且训练样本是随机选取的，即在每次相同的训练样本个数的情况下所抽取的样本是不一样的。然后按照训练后的结果得到的每组的条件概率，对全部数据进行分类。各自在选取相同训练样本个数的条件下进行50次分类，然后求出50次分类的平均正确率，可得下表：先验概率训练样本数 x1和x2 x2和x3 x1和x3 P1=0.2 P2=0.8 m=5 92.54% 74.56% 88.6% m=15 99.98% 94.32% 100% m=25 100% 95.3% 100% m=35 100% 95.32% 100% m=45 100% 95.56 100% P1=0.4 P2=0.6 m=5 88.96% 74.5% 90.88% m=15 99.94% 94.62% 100% m=25 100% 95.64% 100% m=35 100% 95.8% 100% m=45 100% 95.92% 100% P1=0.5 P2=0.5 m=5 90.06% 73.34% 90.14% m=15 99.98% 94.76% 100% m=25 100% 95.82% 100% m=35 100% 96.02% 100% m=45 100% 96.04% 100% 分析表格，可以得到： x1和x2之间的分类，无论先验概率是多少，在选取的样本数m=5时，分类的正确率都比较低，m＝15时，正确率接近100％，样本数再大，正确率就会达到100％。这说明x1和x2之间的分类，在训练样本数较小时，分类效果较差；在样本数选取较大时，分类效果比较理想。 x2和x3之间的分类，在训练样本数较小时，分类正确率很低，仅有70％左右，随着训练样本数的增多，正确率增大，直到选取45个训练样本时正确率大于95％，但达不到100％。这说明x2和x3这两组数据很接近，无论先验概率选取多少，训练样本数是多少