第十七章蒙特卡罗方法.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十七章蒙特卡罗方法.PDF

第十七章 蒙特卡罗方法 随机算法可以粗略地分为两类: 算法和蒙特卡罗算法。 算 法总是精确地返回一个正确答案(或者返回算法失败了)。这类方法通常需要占用随 机量的计算资源(一般指内存或运行时间)。与此相对的,蒙特卡罗方法返回的答案 具有随机大小的错误。花费更多的计算资源(通常包括内存和运行时间)可以减少 这种错误。在任意固定的计算资源下,蒙特卡罗算法可以得到一个近似解。 对于机器学习中的许多问题来说,我们很难得到精确的答案。这类问题很难用 精确的确定性算法如 算法解决。取而代之的是确定性的近似算法或蒙特卡 罗近似方法。这两种方法在机器学习中都非常普遍。本章主要关注蒙特卡罗方法。 采样和蒙特卡罗方法 机器学习中的许多重要工具都基于从某种分布中采样以及用这些样本对目标量 做一个蒙特卡罗估计。 为什么需要采样? 有许多原因使我们希望从某个分布中采样。当我们需要以较小的代价近似许多 项的和或某个积分时,采样是一种很灵活的选择。有时候,我们使用它加速一些很 费时却易于处理的求和估计,就像我们使用小批量对整个训练代价进行子采样一样。 在其他情况下,我们需要近似一个难以处理的求和或积分,例如估计一个无向模 型中配分函数对数的梯度时。在许多其他情况下,抽样实际上是我们的目标,例如 我们想训练一个可以从训练分布采样的模型。 采样和蒙特卡罗方法 蒙特卡罗采样的基础 当无法精确计算和或积分(例如,和具有指数数量个项,且无法被精确简化) 时,通常可以使用蒙特卡罗采样来近似它。这种想法把和或者积分视作某分布下的 期望,然后通过估计对应的平均值来近似这个期望。令 ∑ x x x x 或者 ∫ x xx x 为我们所需要估计的和或者积分,写成期望的形式, 是一个关于随机变量 x 的概 率分布(求和时)或者概率密度函数 (求积分时)。 我们可以通过从 中抽取 个样本 x x 来近似 并得到一个经验平均 值 ∑ x 下面几个性质表明了这种近似的合理性。首先很容易观察到 这个估计是无偏的, 由于 ∑ ∑ x 此外,根据大数定理 ( ),如果样本x 是独立同分布的,那么 其平均值几乎必然收敛到期望值,即 lim

文档评论(0)

shiyouguizi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档