模式识别贝叶斯方法的报告.docVIP

下载本文档

14
0
约4.29千字
约 7页
2020-11-17 发布于山东
举报
版权申诉

模式识别贝叶斯方法的报告.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

模式识别贝叶斯方法实验报告姓名与学号：教师：唐柯目录模式识别贝叶斯方法实验报告 1 目录 2 1 原理 3 1.1 基本思想 3 1.2 工作过程 3 2 实验记录 4 2.1 matlab 程序 4 2.2 特殊情况 4 2.3 实验结果 4 2.4 实验人员任务分配 4 附录 5 原理 1.1 基本思想 ①已知类条件概率密度参数表达式（如符合正态分布）和先验概率（有监督，可统计得到） ②利用贝叶斯公式转换成后验概率 ③根据后验概率大小进行决策分类 1.2 工作过程 1. 每个数据样本用一个 n 维特征向量 X = {x 1 , x 2 ,..., xn} 表示，对应属性 A 1, A 2, ..., A n。 2. m 个类别 C1 ,C2 ,...,Cm（在本实验中只有两类）。给定一个未知类别的数据样本 X ，分类器将预测 X 属于具有最高后验概率（条件 X 下）的类。即将未知的样本分配给类 Ci ，当且仅当： P(Ci | X) P(C j | X) 1 ≤ j ≤ m 且 j ≠ i. 求令 P(Ci | X) 最大的类 Ci 称为最大后验假设。根据贝叶斯定理 P(C i | X) = P(X | C i )*P(C i )/P(X) 由于 P(X) 对于所有类别为常数，只需要 P(X |Ci)*P(C i)最大。类别的先验概率可以统计得到（有监督），所以最大化 P(X | C i )P(Ci )。类别的先验概率 P(C i ) = 类别 C i 的训练样本数 /训练样本总数假定各类别样本之间的属性值相互独立，则 P(X|C i) = Π P(xk|Ci) k=1...n 而概率 P(xk|Ci )可由训练样本估值，按属性离散与否分为 ①离散属性，则 P(x k|Ci ) = Sik/Si Sik 为在属性 A k 上具有值 xk 的类别 Ci 的训练样本数， Si 是类别 Ci 的样本数。 ②连续属性，则通常假定该属性服从高斯正态分布，因此 P(x k|Ci) = 1 1 Xk ( Ci ) ) 2 ( e 2 (Ci ) 2 (Ci ) 其中， (Ci ), (Ci )分别为类别 Ci 的均值和标准差。 4. 对未知样本 X 分类，对每个类 Ci，计算 P(X | C i)*P(C i)。样本 X 被指派到类 Ci，当且仅当： P(X | C i)*P(C i) P(X|C j)*P(C j) 1≤ j≤ mj ≠ i 即 X 被分类到 P(X|C i)*P(C i)最大的类别 Ci 。实验记录 2.1 matlab 程序见附录 2.2 特殊情况在处理样本的第 6 维特征时，其方差实际得到为 0（因为所有样本的第这样在计算后验概率时，会得到除 0 警告，因此将方差改为一个很小的值 6 维特征全为 0.0001。 -1）。 2.3 实验结果运行时间： ≤10 秒训练样本数： 8285 个正样本的先验概率： 5.62% 负样本的先验概率： 94.38% 测试样本数： 2072 个正确识别的样本数： 2030 个识别率： 97.97% 两类样本的均值和方差如表 1 维数 1 2 3 4 5 6 7 8 9 10 正样本 -0.0804 -0.0361 -0.9957 -0.9919 -0.9829 -1.0000 -0.9961 -0.9995 -0.9955 -0.9987 均值负样本 -0.3451 -0.3252 -0.9947 -0.9968 -0.9954 -1.0000 -0.9984 -0.9991 -0.9978 -0.9983 均值正样本 0.3230 0.3804 0.0237 0.0963 0.1868 0.0001 0.0323 0.0068 0.0296 0.0185 方差负样本 0.2735 0.3469 0.0466 0.0403 0.0443 0.0012 0.0173 0.0216 0.0162 0.0359 方差表 1 两类样本的均值和方差表（红色部分是人为调整的值） 2.4 实验人员任务分配本组两人任务分配如下：附录 %模式识别实验贝叶斯分类器 %input ：训练集 train.data，测试集： test.data，每行一个样本，每行的最后一个元素为样本类别号 label %output ：输出预测的类别集和识别率 recogRate %recogRate：正确率 %读入两个矩阵 test 和 train load test.data load train.data testData = test(:,1:(end-1)); trai