第七章：模型选择和模型评估.ppt

下载文档

24
0
约4.18千字
约 39页
2017-05-30 发布于北京
举报
版权申诉
保障服务

第七章：模型选择和模型评估.ppt

1、本文档共39页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

上节课内容总结贝叶斯的概率观点概率描述的是主观信念的程度可以对参数进行概率描述，为参数生成一个概率分布贝叶斯推理的基本步骤先验分布似然模型计算后验分布从后验分布中得到点估计和区间估计点估计：后验均值、后验众数（MAP）后验区间上节课内容总结后验的仿真模拟贝叶斯推理与MLE 例令为的极大似然估计，在合适的正则条件下，后验均值为贝叶斯推理的优点可以方便的结合先验信息数据和先验同等对待由后验可以同时推出点估计和区间估计第七章：模型选择和模型评估内容：估计选择（Ch13）模型选择（Ch14，Ch9，统计学习基础第7章）估计选择有几个不同的估计，哪个估计更好一些？统计决策理论损失函数损失函数：度量真值与估计之间的差异损失函数举例风险函数风险函数：损失的均值一个估计的风险是对平方误差损失，风险为MSE 风险是的函数比较不同的估计，转化为比较不同估计的风险但并不能清楚地回答哪个估计更好风险比较风险比较风险函数的两个单值概述最大风险贝叶斯风险其中为θ的先验。决策规则(Decision Rules) 决策规则是估计的别名最小化贝叶斯风险的决策规则成为贝叶斯规则或贝叶斯估计，即为对应先验 f 的贝叶斯估计其中下界是对所有的估计计算最小化最大风险的估计称为最小最大规则其中下界是对所有的估计计算贝叶斯估计给定一个模型（先验和后验）和损失函数，就可以找到贝叶斯规则若，则贝叶斯规则为后验均值若，则贝叶斯规则为后验中值若为0-1损失，则贝叶斯规则为后验众数最小最大规则找最小最大规则，或者证明一个估计是最小最大估计是一件很困难的事情。但还是有一个简单的方法：有些贝叶斯估计（如风险为常数）是最小最大估计令对应先验 f 的贝叶斯估计：假设则为最小最大估计，且f 称为最小受欢迎先验( least favorable prior)。上述结论一个简单的结果有：如果一个贝叶斯规则的风险为常数，则它是最小最大估计。 MLE为近似最小最大估计对满足弱正则条件的参数模型，极大似然估计近似为最小最大估计。对均方误差损失，通常根据Cramer-Rao 不等式，这是所有无偏估计的方差的下界。 MLE为近似最小最大估计因此对所有估计，有对大数N， MLE为近似最小最大估计。因此，对大多数参数模型，当有大量样本时，MLE近似为最小最大估计和贝叶斯估计。 Many Normal Means 情况不成立（不是大样本）可接受性(Admissibility) 一个估计如果在θ所有值上都比其它估计的风险大，则该估计不是我们所希望的。如果存在一个其它的规则，使得则该估计是不可接受的。否则，是可接受的。可接受性可接受性是与其他表示估计好坏的方法有何关系？在一些正则条件下，如果为贝叶斯规则且有有限风险，则它是可接受的。如果的风险为常数且是可接受的，则它是最小最大估计。许多正态均值(Many Normal Means) Many Normal Means是一个原型问题，与一般的非参数回归或密度估计等价。对这个问题，以前许多关于极大似然估计的正面的结论都不再满足。令，表示数据，表示未知参数， c0，这里参数的数目与观测数据一样多 Many Normal Means MLE为，损失函数为 MLE的风险为最小最大估计的风险近似为，且存在这样一个估计能达到该风险。也就是说，存在风险比MLE更小的估计，因此MLE是不可接受的。在实际应用中，风险的差值可能很重要。因此对高维问题或非参数问题，MLE并不是最优估计。另外在非参数场合，MLE的鲁棒性也不是很好。底线根据这些工具，怎样选择估计呢？如果一个估计是不可接受的，则该估计一定是不好的。如果你信仰贝叶斯观点，则你可以用贝叶斯规则如果最小最大性满足应用要求，可以使