第二部分统计推断.pptVIP

下载本文档

7
0
约2.53千字
约 29页
2018-04-03 发布于天津
举报
版权申诉

第二部分统计推断.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第二部分统计推断.ppt

第二部分：统计推断 Chp6：统计推断概述 Chp7：非参数推断 Chp8：Bootstrap Chp9：参数推断 Chp10：假设检验 Chp11：贝叶斯推断 Chp12：统计决策理论 Chp6：统计推断统计推断/学习利用数据来推断产生数据的分布的过程统计推断的基本问题：我们观测到数据，要推断（估计或学习）F 或 F 的某些性质（如均值和方差）。推断的基本问题推断的基本问题点估计置信区间假设检验统计推断概述统计模型参数模型非参数模型模型估计点估计区间估计假设检验估计的评价无偏性一致性有效性 … 参数模型参数模型可用有限个参数参数化，如也可记为一般形式当为向量，而我们只对其中一部分参数感兴趣，则其余参数称为冗余参量（nuisance parameters ）非参数模型非参数模型粗略地说，非参数模型不能用有限个参数参数化如如例：参数推断 6.1例（一维参数估计）设是独立的Bernoulli p 观测，问题在于如何估计参数p。 6.2例（二维参数估计）假设且PDF ，如则有两个参数。目标是从数据中获得参数。如果仅对μ感兴趣，那么μ是感兴趣参数，而 σ 是冗余参量。例：非参数推断 6.3例（CDF的非参数估计）设是来自CDF F 的独立观测。问题是在假设的条件下估计F。例：非参数推断 6.4例（非参数密度估计）设是CDF F 的独立观测，令是其PDF。假设我们要估计f 。在只假设的条件下，不可能估计出 f。我们需要假设f的平滑性。例如，可假设，其中是满足下述条件的所有概率密度函数的集合类称为Sobolev 空间；是 “波动不大” 的函数的集合。例：非参数推断 6.5例（函数的非参数估计）：令，我们要估计，仅假设μ存在。均值μ可被认为是F的函数，可写成通常，任意F 的函数可认为统计函数/统计泛函。方差：中值：例：监督学习假设有成对的观测数据，如为第i个人的血压，为其寿命 X：特征/独立变量/预测子/回归子 Y：输出/依赖变量/响应变量：回归函数参数回归模型：，其中为有限维如线性回归：为直线集合，非参数回归模型：，其中为无限维如核回归：例：监督学习（续）预测：给定新的X的值，估计Y的值分类：当Y为离散值时的预测回归/曲线拟合/曲线估计：估计函数回归模型：统计推断方法频率推断贝叶斯推断注意在参数模型中，若为参数模型，我们记下标θ表示概率或期望是与有关，而不是对θ求平均点估计点估计是指对某个感兴趣的量的真值做一个最佳估计，这个估计称为或，因为它取决于数据，所以是一个随机变量。但 θ为固定值，虽然未知如果 X1, …,Xn 是从某个分布F的IID数据点，参数θ的点估计为X1, … ,Xn 的函数：抽样分布（Sampling Distribution）的分布称为抽样分布的标准差 standard deviation 称为标准误差 standard error 标准误差的估计值称为估计量的评价标准一个好的估计有什么性质? 无偏性估计的偏差（bias）为若，则该估计是无偏估计。一致性若，则该点估计是一致的。有效性无偏估计中，方差较小的一个更有效（收敛速度更快）偏差—方差分解点估计的性能有时通过均方误差 MSE, mean squared error 来评价： MSE可分解为为了使估计的MSE小，估计的偏差和方差都要小对无偏估计，bias 0，所以偏差—方差分解偏差—方差分解若时，且，则是一致的，即证明：例：Bernoulli分布中的参数估计令为p无偏估计标准误差为所以，为一致估计估计的标准误差为置信区间参数的1-α置信区间为区间，其中和是数据的函数，使得区间 a,b 以1-α的概率覆盖θ 1-α：置信区间的覆盖度 coverage 置信区间表示了我们对未知参数的不确定程度置信区间宽，表示若要对参数有个比较确定的解，需要更多样本数据渐近正态性如果满足则该估计是渐近正态的（asymptotically normal）。如果一个估计是渐近正态的，可以比较方便地得到其置信区间。基于正态分布的置信区间假设，令，即且其中，令则如对95%的置信区间，则95%的置信区间约为例：二项分布的置信区间令其中则根据Hoeffding不等式对每个p，所以为1-α置信区间。根据CLT，则1-α置