贝叶斯统计中后验分布的马尔可夫链蒙特卡洛(MCMC)模拟.docxVIP

贝叶斯统计中后验分布的马尔可夫链蒙特卡洛(MCMC)模拟.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

贝叶斯统计中后验分布的马尔可夫链蒙特卡洛(MCMC)模拟

一、引言

(一)贝叶斯统计的核心问题:后验分布的计算

贝叶斯统计的本质,是将参数视为随机变量——它不是一个固定的“未知常数”,而是有自己的概率分布。这种视角让我们能自然融合先验知识与观测数据:比如研究新药治愈率时,先根据过往研究设定“先验分布”(如认为治愈率在20%~50%的概率更高),再结合临床试验数据(如100人中40人治愈),最终得到“后验分布”——这是我们对治愈率的最新认知。后验分布是贝叶斯推断的核心:要算参数均值、可信区间,或预测未来结果,都得基于它展开。

但问题在于,如何计算后验分布?简单模型(如治愈率的beta-二项模型)有解析解,可现实中模型往往复杂:比如含多个协变量的回归、随时间变化的波动率模型,或层次化随机效应模型。这些模型的后验分布要么高维(参数达几十个),要么无闭合表达式,直接计算几乎不可能。这曾是贝叶斯统计的“致命瓶颈”——直到马尔可夫链蒙特卡洛(MCMC)方法出现。

(二)后验分布计算的挑战

传统计算后验的方法分两类:解析法(仅适用于共轭先验,如beta先验+二项似然得beta后验)和数值积分法(如辛普森法则)。但解析法仅覆盖简单模型,数值积分在高维时完全失效——比如10维积分需计算102?个点,远超计算机能力。这导致20世纪80年代前,贝叶斯统计只能处理简单问题,无法落地复杂场景(如层次模型、高维回归)。

(三)MCMC模拟的应运而生

MCMC的出现打破了这一瓶颈。它的核心思路是:构造一条马尔可夫链,让其稳态分布等于后验分布。运行这条链足够久,待其收敛到稳态后,收集的样本就是后验分布的样本。通过这些样本,我们能估计后验的均值、可信区间等特征——无需直接计算高维积分。这种“抽样替代计算”的思想,让贝叶斯统计从理论走向实践,成为医学、金融、机器学习等领域的核心工具。

二、贝叶斯统计与后验分布的基础认知

(一)贝叶斯统计的核心逻辑

贝叶斯统计与频率派的根本区别,在于对“参数”的认知:频率派认为参数是固定常数,贝叶斯则视其为随机变量。这种转变让先验知识能自然融入:比如研究全新药物时,用“无信息先验”(均匀分布,认为治愈率01概率相等);若有过往小样本数据,用“有信息先验”(如beta分布,集中在20%40%)。

贝叶斯定理是其核心公式:后验分布∝先验分布×似然函数(数据在参数下的概率)。这里的“∝”(正比于)是关键——归一化常数(让后验总和为1的系数)往往难以计算,但MCMC能绕开它(因为接受概率会抵消常数)。

(二)后验分布的定义与意义

后验分布是“给定数据后,参数的概率分布”。比如新药治愈率的后验分布会告诉我们:“治愈率30%40%的概率60%,40%50%的概率30%”——这比频率派的“点估计”(如38%)更丰富,因为它包含了不确定性。

后验分布的价值在于“完整推断”:比如预测下一个病人的治愈概率时,我们从后验中抽一个治愈率p,再用p预测(如p=35%时,治愈概率35%),重复成千上万次得到预测分布——这比点估计更可靠,因为考虑了参数的不确定性。

(三)后验分布计算的传统困境

传统方法的死穴是高维积分。比如10维参数的后验,归一化常数需计算10维积分,每维拆100个点就是102?次计算——这是计算机无法完成的。数值积分在低维有效,但高维时“维度灾难”使其完全失效。这导致MCMC出现前,贝叶斯统计只能用于简单模型,无法处理现实问题(如层次模型、GARCH波动率模型)。

三、MCMC模拟的基本思想与理论基础

(一)蒙特卡洛方法的前世今生

MCMC的底层是蒙特卡洛方法——通过随机抽样解决数值问题。比如算圆周率π:在边长2的正方形内画内切圆(半径1),随机扔点,圆内点比例×4就是π的估计(正方形面积4,圆面积π,比例=π/4)。

蒙特卡洛的优势是维度无关性:不管积分多少维,只要能从目标分布抽样,就能用样本均值估计积分。但问题是,如何从复杂后验分布抽样?这需要结合“马尔可夫链”。

(二)马尔可夫链的核心特性

马尔可夫链是一种“无记忆”的随机过程:下一个状态仅依赖当前状态,与之前无关。比如天气预报,明天天气只和今天有关,与昨天无关。它的关键特性是稳态分布——运行足够久后,状态分布不再变化。比如天气链运行100天后,晴、阴、雨的比例稳定(晴40%、阴30%、雨30%),这就是稳态分布。

(三)MCMC模拟的融合逻辑:用马尔可夫链生成后验样本

MCMC的本质,是构造一条马尔可夫链,让其稳态分布等于后验分布。关键是满足“细致平衡条件”:对任意两个状态θ和θ’,有π(θ)×转移概率(θ→θ’)=π(θ’)×转移概率(θ’→θ)。这保证“从θ到θ’的概率流”等于“从θ’到θ的概率流”,分布因此稳定。

MCMC的核心就是设计满足细致平衡的转移概率。比

文档评论(0)

MenG + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档