- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
mh采样算法推导_ 【综述】马尔可夫链蒙特卡洛采样
(MCMC)
1. 前前⾔⾔
1.1. 采采样样 的的⽤⽤途途
概率推断在⼈ 智能领域中⼴泛运⽤于不确定性的推理与经验学习,然⽽,实⽤的概率模型通常是⾮常复杂且维度很⾼的,进⾏精确的概率
推断时常常会带来很⾼的计算代价。
采样⽅法就是⼀种⾼效的近似推断⽅法。假设我们要求f (x)对p(x)的期望,如式(1)所⽰,⼀种简单的⽅法就是,先得到从p(x)中采样的样本
点,然后进⾏求平均,那么就得到了期望的近似估计,当采样点⾜够多时,结果会⽆限的接近真实的期望,如式(2)所⽰。
(1)
(2)
但是这样做的问题在于,我们通常不知道p(x)的形式,因为通常概率都被写为了配分函数的形式,⽽且常常没有归⼀化,不过未归⼀化的概
率值是很容易求得的;另外,待采样的分布的维度通常很⾼,⼀些简单的采样⽅法在扩展到⾼维度时常常会遇到很多问题。
对于采样问题,我们⼀般的想法是从⼀个容易采样的分布中采样,然后通过⼀些⼿段转化为 ⽬标分布的样本点。
2. 马马尔尔可可夫夫链链蒙蒙特特卡卡洛洛
2.1. Metropolis-Hasting算算法法
马尔可夫链蒙特卡洛⽅法借⽤了马尔可夫链的性质,即每⼀个状态只与其上⼀个状态有关,与其他状态⽆关。给定⼀个初始状态,确定转移
概率,就可以确定⼀条马尔可夫链。为了保证能够从我们的⽬标分布中采样,我们希望转移概率能够满⾜式(3)(Fixed point equation),这
样我们的样本点经过转移之后得到的新的样本点就还是落在 ⽬标分布上,也就达到了我们的⽬的。
(3)
但是在实践中上式⼀般不易满⾜,⼀般是通过保证(4)式来使(3)式满⾜,也即保证detailed balance,把(4)式两边求和就可得到(3)式,过
程见(5)式。
(4)
(5)
满⾜detailed balance最简单的⽅法是为两边同时乘以⼀个接受率得到新的转移核。
(6)
假设我们找的转移核不满⾜细致平衡条件,让式(4)两边同时乘以式(6)中的接受率,新的式⼦就能保证满⾜细致平衡条件了。图⼀展⽰了推
导过程 :
图图⼀⼀
构造容易采样的提议分布,并从中采取样本点,通过上述接受率决定是否接受,这样的采样⽅法被称为Metropolis-Hasting (MH)算法。
2.2. Gibbs sampling Method
吉布斯采样⽅法是MH算法的⼀种具体的形式。算法过程如图⼆所⽰ :
图图⼆⼆
每次只采样本点的⼀个维度,把剩余的其他维度的值作为条件,采出某⼀个维度的值后,在随后的其他维度的采样中直接利⽤刚刚采出的新
值。相⽐之下,MH算法是每⼀次把上⼀个点作为条件来采出新点,所有维度同时进⾏。
吉布斯采样算法的好处在于其操作相对来说⽐较简单,⽽且吉布斯采样的接受率是⼀。把吉布斯采样的条件分布放⼊接受率的表达式中,利
⽤
技巧,可以发现
接受率右侧表达式分⼦分母相等,接受率恒为⼀。
2.3. Hamiltonian Monte Carlo Method
汉密尔顿蒙特卡洛 (HMC)采样是⼀种动⼒学采样⽅法,也是现如今最通⽤的采样⽅法。在MH算法与吉布斯采样⽅法中,下⼀个样本点与
当前样本点之间的相关性都不可避免会很强,因为当前样本点是下⼀个样本点的条件。这样的采样路径是随机游⾛的,对 ⽬标分布的探索效
率⽐较低下。
HMC通过引⼊辅助的动量变量,把待采样的变量作为位置变量,把⼆者纳⼊⼀个势能与动能守恒的动⼒学系统,通过采样点在动⼒学系统
中随机的游⾛来得到两个变量的联合的采样点,舍去辅助变量,剩下的就是待采样的位置变量了。在探索⽬标分布时,位置变量的变化与能
量的梯度 (动量的⼤⼩)有关,这样的采样过程使得位置变量的变化可以更有针对性,⽽不是效率低下的随机游⾛。
⾸先,定义⼀个能量守恒的动⼒学系统 :
(7)
其中H代表总能,U、K分别代表势能与动能,势能就是我们所要采的分布,动能⼀般设为⾼斯分布。
为了模拟动⼒学系统,采取离散化的⽅法,让动量半步更新,位置⼀步更新,具体如式(8- 10)所⽰ :
(8)
(9)
(10)
换成能量的形式:
图图三三
这样的离散化步骤也被称为leap frog,⼀般的HMC算法交替地进⾏着⼀系列的离散化步骤之后,对动量进⾏⼀个随机的更新,然后进⾏下
⼀轮的离散化步骤。
观察图三中的离散化步骤,如果我们倒着执⾏这些步骤,其实可以从采样得到的下⼀个点重新回到上⼀个点,也就是说这样的采样转移核是
您可能关注的文档
最近下载
- 人教版(2024)一年级数学上册《10的认识》(课件).pptx VIP
- 2024全国职业院校技能大赛GZ106研学旅行赛项规程+赛题 (3).docx VIP
- 八年级英语上册各单元练习题及专题语法习题.doc VIP
- FANUC工业机器人集成359.pptx VIP
- 高温气冷堆核电站三壳组对专用工装及安装方法.pdf VIP
- 【医学】呼吸内科诊疗常规 共(29页).doc VIP
- 公司财务原理 第十一版 习题答案 - Principles of Corporate Finance ,11th edition ,solution.pdf VIP
- 电气控制与S7-1200 PLC应用技术教程郑海春习题答案.docx VIP
- 《网络安全》安全教育PPT课件.pptx VIP
- 《结核病患者外周血淋巴细胞亚群检测及临床应用专家共识》(2020)要点.docx VIP
文档评论(0)