- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE 7
两类正态分布模式的贝叶斯判别
硕633 3106036072 赵杜娟
一.实验目的
1.理解贝叶斯判别原则,编写两类正态分布模式的贝叶斯分类程序;
2.了解正态分布模式的贝叶斯分类判别函数;
3.通过实验,统计贝叶斯判别的正确率。
二.实验原理
(1)贝叶斯判别原则
对于两类模式集的分类,就是要确定x是属于类还是类,这要看x来自类的概率大还是来自类的概率大,根据概率的判别规则,可以得到:
如果 则
如果 则 (1.1)
利用贝叶斯定理,可得
式中,亦称似然函数。把该式代入(1.1)式,判别规则可表示为:
则
则
或写成: 则
则 (1.2)
这里,称为似然比,称为似然比的判决阈值。该式称为贝叶斯判别。
(2)正态分布模式的贝叶斯分类器判别原理
具有M种模式类别的多变量正态分布的概率密度函数为:
(1.3)
式中,是维列向量; 是维均值向量; 是协方差矩阵;为矩阵的行列式。且有 ; ;表示对类别属于的模式作数学期望运算。
可见,均值向量由n个分量组成,协方差矩阵由于其对称性故其独立元素只有个,所以多元正态密度函数完全由个独立元素所确定。取自一个正态总体的样本模式的分布是聚集于一个集群之内,其中心决定于均值向量,而其分布形状决定于其协方差矩阵,分布的等密度点的轨迹为超椭圆,椭圆的主轴与协方差矩阵的本征向量的方向一致,主轴的长度与相应的协方差矩阵的本征值成正比。
类别的判别函数可表示为:
对于正态密度函数,可对判别函数取自然对数,即:
将(1.3)代入上式,简化后可以得到:
这是正态分布模式的贝叶斯判别函数。显然,上式表明是超二次曲面,所以对于两类正态分布模式的贝叶斯分类器,两个模式类别之间用一个二次判别界面分开,就可以求得最优的分类效果。
对于两类问题,判别界面方程为:
即:
判别条件为: 如果, 则
如果, 则
应指出,贝叶斯分类规则是基于统计的概念,因此要有大量的模式样本,才能获得最优的结果。
三 实验内容及结果分析
1.根据实验要求,在本实验中将三组分别服从不同参数的正态分布数据两两进行分类,利用贝叶斯原理首先设定其先验概率,并从每组数据中随机抽取一定的训练样本数来进行参数估计,从而得到三组数据各自的条件概率。
2.根据条件概率,利用贝叶斯判别原则进行分类实验,得到结果。
3.实验结果分析
分别对x1,x2和x3两两进行实验,每次选取不同的先验概率和不同的训练样本数,进行训练,且训练样本是随机选取的,即在每次相同的训练样本个数的情况下所抽取的样本是不一样的。然后按照训练后的结果得到的每组的条件概率,对全部数据进行分类。各自在选取相同训练样本个数的条件下进行50次分类,然后求出50次分类的平均正确率,可得下表:
先验概率
训练样本数
x1和x2
x2和x3
x1和x3
P1=0.2
P2=0.8
m=5
92.54%
74.56%
88.6%
m=15
99.98%
94.32%
100%
m=25
100%
95.3%
100%
m=35
100%
95.32%
100%
m=45
100%
95.56
100%
P1=0.4
P2=0.6
m=5
88.96%
74.5%
90.88%
m=15
99.94%
94.62%
100%
m=25
100%
95.64%
100%
m=35
100%
95.8%
100%
m=45
100%
95.92%
100%
P1=0.5
P2=0.5
m=5
90.06%
73.34%
90.14%
m=15
99.98%
94.76%
100%
m=25
100%
95.82%
100%
m=35
100%
96.02%
100%
m=45
100%
96.04%
100%
分析表格,可以得到:
x1和x2之间的分类,无论先验概率是多少,在选取的样本数m=5时,分类的正确率都比较低,m=15时,正确率接近100%,样本数再大,正确率就会达到100%。这说明x1和x2之间的分类,在训练样本数较小时,分类效果较差;在样本数选取较大时,分类效果比较理想。
x2和x3之间的分类,在训练样本数较小时,分类正确率很低,仅有70%左右,随着训练样本数的增多,正确率增大,直到选取45个训练样本时正确率大于95%,但达不到100%。这说明x2和x3这两组数据很接近,无论先验概率选取多少,训练样本数是多少
您可能关注的文档
- 测量小灯泡电功率的探究实验.doc
- 《拖拉机汽车学》期末复习题(20170517214825).pdf
- 塑料原料检验标准.doc
- 地质勘探技术服务合同.doc
- 绿色建造模式:新型建筑工业化.docx
- 合作开发协议(新合作模式).docx
- 创新校企合作模式推进创新人才培养.doc
- 公共管理学考试题型及复习重点.doc
- 喷塑加工协议书.doc
- 喷塑工艺流程说明.doc
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
最近下载
- 铁路工程概预算编制办法(铁建设[2006]113号文终稿).pdf
- 【智慧树】【知到】大学生劳动就业法律问题解读(2024最新版) 章节测试答案.docx VIP
- 北师大版七年级上册数学课件第六章 数据的收集与整理.pptx
- 正川ZC200系列通用变频器使用说明书 选件.doc
- 2024年疾控大学习新兴技术在传染病预测预警中的应用答案.docx VIP
- 统编版语文六年级上册《童年》整本书阅读推进课(课件).pptx
- 新教材人教版高中物理必修第三册讲义(知识点考点汇总及配套习题含解析).pdf
- 临床基础知识题库及答案 .pdf
- 金色的鱼钩课本剧红色经典长征英语剧本.docx VIP
- 相亲简历模板(男).docx VIP
文档评论(0)