- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE 7
两类正态分布模式的贝叶斯判别
硕633 3106036072 赵杜娟
一.实验目的
1.理解贝叶斯判别原则,编写两类正态分布模式的贝叶斯分类程序;
2.了解正态分布模式的贝叶斯分类判别函数;
3.通过实验,统计贝叶斯判别的正确率。
二.实验原理
(1)贝叶斯判别原则
对于两类模式集的分类,就是要确定x是属于类还是类,这要看x来自类的概率大还是来自类的概率大,根据概率的判别规则,可以得到:
如果 则
如果 则 (1.1)
利用贝叶斯定理,可得
式中,亦称似然函数。把该式代入(1.1)式,判别规则可表示为:
则
则
或写成: 则
则 (1.2)
这里,称为似然比,称为似然比的判决阈值。该式称为贝叶斯判别。
(2)正态分布模式的贝叶斯分类器判别原理
具有M种模式类别的多变量正态分布的概率密度函数为:
(1.3)
式中,是维列向量; 是维均值向量; 是协方差矩阵;为矩阵的行列式。且有 ; ;表示对类别属于的模式作数学期望运算。
可见,均值向量由n个分量组成,协方差矩阵由于其对称性故其独立元素只有个,所以多元正态密度函数完全由个独立元素所确定。取自一个正态总体的样本模式的分布是聚集于一个集群之内,其中心决定于均值向量,而其分布形状决定于其协方差矩阵,分布的等密度点的轨迹为超椭圆,椭圆的主轴与协方差矩阵的本征向量的方向一致,主轴的长度与相应的协方差矩阵的本征值成正比。
类别的判别函数可表示为:
对于正态密度函数,可对判别函数取自然对数,即:
将(1.3)代入上式,简化后可以得到:
这是正态分布模式的贝叶斯判别函数。显然,上式表明是超二次曲面,所以对于两类正态分布模式的贝叶斯分类器,两个模式类别之间用一个二次判别界面分开,就可以求得最优的分类效果。
对于两类问题,判别界面方程为:
即:
判别条件为: 如果, 则
如果, 则
应指出,贝叶斯分类规则是基于统计的概念,因此要有大量的模式样本,才能获得最优的结果。
三 实验内容及结果分析
1.根据实验要求,在本实验中将三组分别服从不同参数的正态分布数据两两进行分类,利用贝叶斯原理首先设定其先验概率,并从每组数据中随机抽取一定的训练样本数来进行参数估计,从而得到三组数据各自的条件概率。
2.根据条件概率,利用贝叶斯判别原则进行分类实验,得到结果。
3.实验结果分析
分别对x1,x2和x3两两进行实验,每次选取不同的先验概率和不同的训练样本数,进行训练,且训练样本是随机选取的,即在每次相同的训练样本个数的情况下所抽取的样本是不一样的。然后按照训练后的结果得到的每组的条件概率,对全部数据进行分类。各自在选取相同训练样本个数的条件下进行50次分类,然后求出50次分类的平均正确率,可得下表:
先验概率
训练样本数
x1和x2
x2和x3
x1和x3
P1=0.2
P2=0.8
m=5
92.54%
74.56%
88.6%
m=15
99.98%
94.32%
100%
m=25
100%
95.3%
100%
m=35
100%
95.32%
100%
m=45
100%
95.56
100%
P1=0.4
P2=0.6
m=5
88.96%
74.5%
90.88%
m=15
99.94%
94.62%
100%
m=25
100%
95.64%
100%
m=35
100%
95.8%
100%
m=45
100%
95.92%
100%
P1=0.5
P2=0.5
m=5
90.06%
73.34%
90.14%
m=15
99.98%
94.76%
100%
m=25
100%
95.82%
100%
m=35
100%
96.02%
100%
m=45
100%
96.04%
100%
分析表格,可以得到:
x1和x2之间的分类,无论先验概率是多少,在选取的样本数m=5时,分类的正确率都比较低,m=15时,正确率接近100%,样本数再大,正确率就会达到100%。这说明x1和x2之间的分类,在训练样本数较小时,分类效果较差;在样本数选取较大时,分类效果比较理想。
x2和x3之间的分类,在训练样本数较小时,分类正确率很低,仅有70%左右,随着训练样本数的增多,正确率增大,直到选取45个训练样本时正确率大于95%,但达不到100%。这说明x2和x3这两组数据很接近,无论先验概率选取多少,训练样本数是多少
您可能关注的文档
- 测量小灯泡电功率的探究实验.doc
- 《拖拉机汽车学》期末复习题(20170517214825).pdf
- 塑料原料检验标准.doc
- 地质勘探技术服务合同.doc
- 绿色建造模式:新型建筑工业化.docx
- 合作开发协议(新合作模式).docx
- 创新校企合作模式推进创新人才培养.doc
- 公共管理学考试题型及复习重点.doc
- 喷塑加工协议书.doc
- 喷塑工艺流程说明.doc
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
最近下载
- 2024年河北省继续医学教育公共必修课参考答案.docx VIP
- 世界古代史课件-第三章上古西亚.pptx VIP
- 苏宁易购财务风险财务风险成因探析及防范对策研究.docx
- 世界古代史课件-第六章上古罗马.pptx VIP
- 2024年河北省继续医学教育公共选修课参考答案.pdf VIP
- 世界古代史课件-第五章上古希腊.pptx VIP
- 数据采集系统说明.pdf
- 浅论威廉莎士比亚的悲剧哈姆雷特及其艺术特色.doc
- 线性代数与空间解析几何案例智慧树知到期末考试答案章节答案2024年哈尔滨工程大学.docx
- 2024广东惠州市教育局赴高校招聘市直公办中小学校教师224人笔试备考试题及答案解析.docx
文档评论(0)