产生式判别式.pptVIP

下载本文档

7
0
约2.31千字
约 22页
2023-07-30 发布于广东
举报
版权申诉

产生式判别式.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第一页，共二十二页，2022年，8月28日内容提要摘要简介产生式模型（Generative Model）判别式模型（Discriminative Model ）两者之间的关系实验分析第二页，共二十二页，2022年，8月28日摘要产生式模型：无穷样本==》概率密度模型 =＝》产生模型==》预测判别式模型：有限样本==》判别函数 = 预测模型==》预测第三页，共二十二页，2022年，8月28日简介简单的说，假设o是观察值，q是模型。如果对P(o|q)建模，就是Generative模型。其基本思想是首先建立样本的概率密度模型，再利用模型进行推理预测。要求已知样本无穷或尽可能的大。这种方法一般建立在bayes理论的基础之上。第四页，共二十二页，2022年，8月28日简介如果对条件概率 P(q|o)建模，就是Discrminative模型。基本思想是有限样本条件下建立判别函数，不考虑样本的产生模型，直接研究预测模型。代表性理论为统计学习理论。这两种方法目前交叉较多。第五页，共二十二页，2022年，8月28日产生式模型估计的是联合概率分布（joint probability distribution），p(class, context)=p(class|context)*p(context)。＝p(context|class)*p(class) 用于随机生成的观察值建模，特别是在给定某些隐藏参数情况下。在机器学习中，用于直接对数据建模,或作为生成条件概率密度函数的中间步骤。通过使用贝叶斯规则可以从生成模型中得到条件分布。第六页，共二十二页，2022年，8月28日产生式模型特点：主要是对后验概率建模，从统计的角度表示数据的分布情况，能够反映同类数据本身的相似度。优点:由于产生式方法可以在联合分布空间插入变量、不变量、独立性、先验分布等关系的知识。因此，在联合分布空间，通用性（或称多面性）是其本质。这包括了系统中的未知的、观察到的、输入或输出变量，这就使得产生式概率分布成为一个非常灵活的建模工具。第七页，共二十二页，2022年，8月28日产生式模型缺点产生式分类器需产生的所有变量的联合概率分布仅仅是分类任务的中间目标，对该中间目标优化的过程，牺牲了最终分类判别任务上的资源和性能，影响了最终的分类性能。第八页，共二十二页，2022年，8月28日产生式模型常用方法 Gaussians, Naive Bayes, Mixtures of multinomialsMixtures of Gaussians, HMMsBayesian networksMarkov random fields 第九页，共二十二页，2022年，8月28日判别式模型又可以称为条件模型，或条件概率模型。估计的是条件概率分布(conditional distribution) 判别式方法并不对系统中变量和特征的基本分布建模，仅仅对输入到输出之间映射的最优化感兴趣。因此，仅需调整由此产生的分类边界，没有形成可对系统中变量建模的生成器的中间目标，可以得到准确率更高的分类器。第十页，共二十二页，2022年，8月28日判别式模型主要特点：寻找不同类别之间的最优分类面，反映的是异类数据之间的差异。优点:相比纯概率方法或产生式模型，分类边界更灵活；能清晰的分辨出多类或某一类与其他类之间的差异特征，适用于较多类别的识别判别模型的性能比产生模型要简单，比较容易学习第十一页，共二十二页，2022年，8月28日判别式模型缺点：不能反映训练数据本身的特性。可以告诉你的是1还是2，但没有办法把整个场景描述出来；判别式方法在训练时需要考虑所有的数据元组，当数据量很大时，该方法的效率并不高；缺乏灵活的建模工具和插入先验知识的方法。因此，判别式技术就像一个黑匣子，变量之间的关系不像在产生式模型中那样清晰可见。第十二页，共二十二页，2022年，8月28日判别式模型常见的主要有：logistic regressionSVMsneural networksNearest neighborConditional random fields(CRF): 目前最新提出的热门模型，从NLP领域产生的，正在向ASR和CV上发展。第十三页，共二十二页，2022年，8月28日判别式模型主要应用：Image and document classificationBiosequence analysisTime series prediction 第十四页，共二十二页，2022年，8月28日两者之间的关系由生成