统计中的Bootstrap方法是指什么？与MonteCarlo方法有什么联系与区别？.docVIP

下载本文档

119
0
约7.8千字
约 11页
2020-11-20 发布于山东
举报
版权申诉

统计中的Bootstrap方法是指什么？与MonteCarlo方法有什么联系与区别？.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

统计中的 Bootstrap 方法是指什么？与 Monte Carlo 方法有什么联系与区别？ JackDiamond 的回答 (73 票 )】:风马牛不相及，举个简单的例子 (关于一个分布的平均值 )来帮你理解 bootstrap 和 Monte Carlo ，比如现在有一个分布 F...1. Bootstrap: 如果我无法知道 F 的确切分布，手上仅有一组从 F 中 iid 抽样的样本 (X_1, ..., X_n) ，我想检验“F的均值是否为 0”。看起来这个不可能，因为我只有一个 ar{X} 的点估计，而并不知道 ar{X} 的分布。 Bootstrap 的魔术是现在我把 (X_1, ..., X_n) 这个样本当做总体，从中 (有放回地 ) 重新抽样，重抽样样本大小仍为 n，那么每一次重抽样就可以得到一个“样本均值”，不断地重抽样我就得到了一个 ar{X} 的“分布”这。样接下来我就可以构造 confidence interval 并做检验了。虽然实践中 bootstrap 的重抽样步骤都是用 Monte Carlo 方法来模拟重抽样样本统计量的分布，但是严格地说这个分布原则上可以精确计算。而如果待估统计量比较简单， bootstrap 的结果有时甚至可以直接用 (X_1, ..., X_n) 的某种统计量表示出来，从而并不需要真正地“重抽样”。当然实际应用中绝大多数时候重抽样分布的解析表达式都会太复杂，所以用模拟代替计算。 (关于 bootstrap 的更多讨论见此答案下的评论，特别是 Lee Sam 提的问题 )2. Monte Carlo: 如果我知道 F 的确切分布，现在想计算 mean(F) ，但是 F 的形式太复杂 (或者我这人太懒) ；另一方面我又知道如何从 F 中抽样，于是就抽一个样本出来，拿样本均值充数。一般来说bootstrap 干的事大都跟这个例子中干的事差不多，而 Monte Carlo 的应用要广泛和多元化得多了。所以两者连“区别”都谈不上，就是两码事。【赵卿元的回答 (20 票 )】 :谢邀。 Monte Carlo 是一个更基础的想法。在很多数学、物理或者工程问题种有很多无法写出 closed form 的表达式，为了能得到数值上的一个解，需要通过随机采样的方法去估计。 Bootstrap 是重新改变统计学的一个想法。统计推断的主体总是一个的随机变量分布。在这个分布很复杂无法假设合理的参数模型时， bootstrap 提供了一种非参数的推断方法，依靠的是对观测到的样本的重新抽样（ resampling ），其实是用 empirical distribution 去近似真正的 distribution 。这两种方法从目的到用法都完全不同，有联系的话就是都涉及到计算机抽样。 ============================================ ==================@ 豆豆叶觉得“ bootstrap是对 empirical distribution 的 monte carlo ”的说法更合理，我保留意见。我认为 monte carlo 和 sampling 还是不能互为替换的。我认为 Monte Carlo 和 Bootstrap 更多的是两种思想，都是基于 random sampling 去近似某一目标。 Monte Carlo 的目标一般是一个难以计算的积分， bootstrap 的目标一般是统计推断。【马拉轰的回答 (6 票 )】 :这个问题又该邀请 @ 赵卿元了，我先抛砖引玉吧。 Bootstrap 的中文翻译是“自助法”，由后来成为斯坦福统计系主任的 Bradley Efron 在 70 年代提出。中心思想是通过从样本中重抽样（ resample 是这么翻的么？），构建某个估计的置信区间。抽象的说，通过样本得到的估计并没有榨干样本中的信息， bootstrap 利用重抽样，把剩余价值发挥在了构建置信区间上。 Bootstrap 因为其通用性的和简便性而被广泛使用（只要有样本就可以 resampling ，就可以 bootsrap ，任何分布都能做，只是消耗一些计算资源）。特别是在各种统计（机器）学习算法大大复杂了“估计”，bootstrap 的实用性太明显了。至于 Bootstrap 和 Monte Carlo 有什么联系与区别，这两个本身不是对应的概念，怎么个区别法呢？ Bootstrap 在重抽样的时候，一般采用 sample with replacement 而不是穷尽所有组合，也可以认为用到了 Monte