贝叶斯学习过程.ppt

下载文档 降价啦

77
0
约5.44千字
约 48页
2017-02-26 发布于天津
举报
版权申诉
保障服务

贝叶斯学习过程.ppt

1、本文档共48页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

贝叶斯学习过程

* * * * * ML估计直接把估计值带入p（x | theta）即可，而贝叶斯估计要通过公式计算p（x | D）越尖越接近ML估计 * Mu_0代表先验知识，\hat{mu}_n代表经验知识贝叶斯估计的mu均值在二者之间，系数由sigma_0决定 sigma_0越大，表示先验知识的不确定性越大，则mu_n更接近经验知识\hat{mu}_n mu_n被看作mu，而方差增加了，因为对mu估计的不确定性增大了对x的不确定性增量学习特点：学习过程随着观察数据的不断获得而不断进行，获得一个新的数据样本时，不需从头训练，只需根据当前样本对已有模型进行改进 “拖尾”表示theta的先验知识影响仍在理论上，贝叶斯有更强的基础，但实践中，ml更加简便使用，而且效果类似 ML估计-高斯情况：和均未知 x为多元变量情况参数向量在下的对数似然的ML估计数据集D的样本均值估计的偏差的ML估计是有偏估计，即对所有可能的大小为n的样本集进行协方差矩阵的ML估计，其数学期望并不等于实际的协方差矩阵的无偏估计由于 ML估计为渐进无偏估计，即随着样本数n的增大，趋近于C 数据集D的样本协方差矩阵 Part 2 贝叶斯估计贝叶斯估计给定参数形式的概率密度函数，其中的未知参数表示为向量有关的先验概率密度数据集求解参数向量的后验概率密度 x的后验概率密度贝叶斯估计贝叶斯估计最大似然估计贝叶斯估计为明确数据集D的作用，类似于ML估计，贝叶斯决策所需后验概率可重新写作简化贝叶斯估计核心问题已知一组训练样本D，这些样本都是从固定但未知的概率密度函数p(x)中独立抽取的，要求根据这些样本估计基本思路假设为已知参数形式的概率密度是在D下的后验概率密度——通过贝叶斯估计得到的如果在某一个值附近形成最显著的尖峰，则贝叶斯估计通过观察数据集D，将先验概率密度转化为后验概率密度，并期望其在真实的值处有一个尖峰高斯情况：单变量，未知，已知目标概率密度函数未知，但是其分布已知已知，可简化为根据选择某个具体的值高斯情况：单变量，未知，已知应用贝叶斯规则计算的后验概率其中，是一个依赖于样本集的归一化系数，该系数不依赖于假设，其中和均已知高斯情况：单变量，未知，已知也呈高斯分布称为共轭先验（conjugate prior），称为复制密度（reproducing density）计算样本均值高斯情况：单变量，未知，已知观察结论如果当时，如果退化情况：如果样本均值和为1，说明位于和的连线上 ML估计当获得足够多的样本后，和的具体数值的精确假定变得无关紧要，将收敛于样本均值先验知识和经验数据各自的贡献取决于和的比值，这个比值称为决断因子（dogmatism）高斯情况：单变量，未知，已知观察结论随着样本数n的递增，单调递减，即新增的样本能够减少关于的估计的不确定性。随着n的增大，的波形变得越来越尖。贝叶斯学习过程高斯情况：单变量，未知，已知观察结论随着样本数n的递增，单调递减，即新增的样本能够减少关于的估计的不确定性。随着n的增大，的波形变得越来越尖。贝叶斯学习过程高斯情况：单变量，未知，已知类条件概率密度高斯情况：单变量，未知，已知类条件概率密度的参数形式为贝叶斯估计的结果为对估计的不确定性增加了x的不确定性（））贝叶斯决策规则高斯情况：多变量，未知，已知假设所以已知未知高斯情况：多变量，未知，已知类条件概率密度一种较简单的理解视角贝叶斯估计的一般过程第一阶段第二阶段第一阶段第二阶段递归的贝叶斯学习明确样本集中的样本个数贝叶斯学