关于一种基于后验运算的混合模式识别方法的论文读书报告.docVIP

下载本文档

4
0
约 6页
2018-05-08 发布于重庆
举报
版权申诉

关于一种基于后验运算的混合模式识别方法的论文读书报告.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

关于一种基于后验运算的混合模式识别方法的论文读书报告

关于一种基于后验运算的混合模式识别方法的论文读书报告在模式识别中，线性判别式分析(LDA)、二次判别式分析(QDA)和邻节点分析（NN）犹豫简单并且易于计算经常被使用。但是，这些分析方法依然有利有弊。就LDA和QDA方法来说，这些参数式分类器的性能表现取决于相关的假设模型：当参数模型有效时，特别实在模型较小时，参数式方法（主要是LDA和QDA）要优于非参数式方法（主要是NN），但是当参数模型无效时，非参数式方法又优于参数式方法。因此，如果当模型假设正确时，分类器的性能能类似于参数式分类器，而当模型假设不正确时，性能又能类似于非参数式分类器，基于这个思想，这篇文章提出了一种混合式的基于后验运算的模式识别方法。这种方法能克服参数式和非参数式分类方法的缺陷和不足，并且结合了它们各自的优势。对于这种新方法，文章在接下来的部分进行了数据验证。在确定好需要进行后验运算的的集合S和S*后，文章使用了6个模拟数据集合来评估混合分类器的性能，其数据如下图：下面对数据结果中的示例进行依次的说明，示例1描述的是；两个变量相差很小的情形，在此假设下，QDA的错误率是27.53%，接近于贝叶斯风险，而LDA的错误率是48.99%。因此，QDA的性能比LDA性能要优越；同时，NN-LCV和NN-CV的错误率接近于33%。但是我们将LDA和NN分类器混合时，混合方法的性能是34%，接近于NN方法，而QDA和NN分类器混合时，错误率为27%，性能接近于QDA方法。因此，可以看出混合式方法的性能接近于限定情况下的最佳方法。接下来的示例2-5则依次对不同情况下的LDA、QDA和NN以及混合方法的性能进行了验证，最终得出结论为在各种情况下，混合方法的性能接近于最优方法。为了保证结果的健壮性，文章继续使用了18个标准数据集（见下图）来验证以上方法的性能。在这个验证过程中，文章作者使用了高斯分布作为参数模型，混合分类器则是LDA、QDA和NN分类器三种的混合。在使用这些标准数据集进行性能测试后，我们能得出结论：当参数式方法（主要是LDA和QDA）要优于NN分类器的情况下，混合分类器的性能类似于参数式分类器，并且要优于NN分类器。举例来说，在下图的详细数据中，biomed和diabets数据中，NN分类器的错误率比QDA要高，同时混合分类器的错误率接近于QDA。另一方面，当LDA和QDA的错误率都高于NN分类器时，混合分类器的错误率则接近于NN分类器。这一点在sonar数据集中有很好显示。上面几部分的内容主要关注与在集合S*中的一个数据集合的观测结果。接下来要关注的则是在不同的分类器中使用后验运算后，将结果进行聚合，在这种流行方法中，混合分类器的表现。 1.首先是对比单一聚合和多量程聚合下混合分类器的性能。可以看到，在总数为72的示例中，有53个，多量程的分类器有更低的错误率，在这53个中，更有25个的错误率比单量程的情况下低5%。随后，文中计算了再不同数据集中，不同方法的效率，如图下：由这两幅图也能得出结论，使用多量程的混合分类器要优于单参数式或者非参数式分类器 2. 计算使用多量程方法的混合分类器的性能并与其他聚合方法进行比较文中提出了两种聚合方法，被称为LogWeight和LogWeight-2,使用这两种聚合方法，我们在18个标准数据集上进行了测试，其结果可用下面的两个图来表示。 3.在对混合分类器进行了聚合研究后，作者又对一些参数式和非参数式分类器的聚合进行了研究途中显示了MSCV-2方法是一个有效计算的好选择，而MSLCV-2是我们应当避免的选项。同时，Fig.4(a)也显示了堆栈和MSCV-2方法的效率是相同的，但是后者更加稳定，需要的计算时间也更少。Fig.4(b)则显示了对于MSLCV，我们同时使用LDA和QDA来聚合能获得更出色的性能表现。 4.这一部分的最后，作者对局部自适应聚合进行了讲解。局部自适应聚合，即是在测量空间中不同的部分使用不同的测量方法进行聚合。例如，在某些部分，参数式分类器性能较优而在另一些部分非参数式分类器性能要优。下图是测试结果，如图所示，在测量空间的某一部分，如果贝叶斯分类器是线性的，LDA方法则优于NN分类器，但是在其他部分，NN分类器则要优于LDA。所以，基于这一结果，我们可以混合LDA和NN分类器，在一部分使用LDA分类器，而在另一部分使用NN分类器结论这篇文章中，作者发现并提出了一种能用于改善参数式和非参数式分类器的混合分类器。当潜在数据集类似于假定的参数模型时，混合方法的性能通常与参数式方法相似，并且好于非参数式方法。然而，在非性能参数方面，混合方法能提供自动的安全保障，而参数式方法不能。当真实的数据总体分布与假定的参数模型相差很远时，混合式分类器的性能与非参数式方法