r语言中的blockgibbs吉布斯采样贝叶斯多元线性回归.docxVIP

r语言中的blockgibbs吉布斯采样贝叶斯多元线性回归.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R 语言中的 block Gibbs 吉布斯采样贝叶斯多元线性 回归 展开全文 原文链接 /?p=11617 在这篇文章中,我将对多元线性回归做同样的事情。我将得 出 block 的 Gibbs 采样器所需的条件后验分布。然后,我将 对采样器进行编码,并使用模拟数据对其进行测试。 贝叶斯模型 假设我们有一个样本量的主题。贝叶斯多元回归假设该向量 是从多元正态分布中提取的 ,通过使用恒等矩阵,我们假 设独立的观察结果。正式地, 到目前为止,这与 环境中看到的多元正态回归相同。则将 概率最大化可得出以下解 : 贝叶斯模型是通过指定为一个先验分布得到 。在此示例中, 我将在以下情况下使用 先验值 block Gibbs 在对采样器进行编码之前,我们需要导出 Gibbs 采样器的 每个参数的后验条件分布。 条件后验取更多的线性代数。 这是一个非常漂亮和直观的结果。条件后验的协方差矩阵是 协方差矩阵的频繁估计, 还要注意,条件后验是一个多元分布,因为它是一个向量。 因此,在 Gibbs 采样器的每次迭代中,我们从后验画出一个 完整的矢量 。 模拟我模拟的 结果向量。 运行 Gibbs 采样器 会生成对真实系数和方差参数的估计。 运行了 500,000 次迭代。修整周期为 100,000 次,修整了 10 次迭代。 以下是 MCMC 链的图,其中真实值用红线表示。 # calculate posterior summary statistics (stats not used in rest of code)post_sum_statslt;-post_dist %gt;% group_by(param) %gt;% summarise(median=median(draw), lwr=quantile(draw,.025), upr=quantile(draw,.975)) %gt;% mutate(true_vals=c(tb,tphi))# merge on summary statisticspost_dist lt;- post_dist %gt;% left_join(post_sum_stats, by= ‘ param )# plot MCMC Chainsggplot(post_dist,aes(x=iter,y=draw)) + geom_line() + geom_hline(aes(yintercept=true_vals, col= ‘ red ), facet_grid(paramshow.legend=FALSE)+ ~ .,scale= ‘ free_y ,switch = them‘e_ybw()) + xlab( ‘ Gibbs facet_grid(param Sample Iteration +y)lab( ‘ MCMChains +) ggtitle( Gib‘bs Sampler MCMC Chains by Parameter ) 这是 修整后参数的后验分布: rsehdow.l)e,gendfree_x ,switch =ggplot(post_dist,aes(x=draw)) geom_histogram(aes(x=draw),bins=50) geom_vline(aes(xintercept = true_vals,col= = rsehdow.l)e,gend free_x ,switch = + theme_bw() + xlab( ‘ PosteriorDistributions + ) 似乎我们能够获得这些参数的合理后验估计。为了确保贝叶 斯估计器正常工作, 我对 1,000 个模拟数据集重复了此练习。 这将产生 1,000 组后验均值和 1,000 组 95%可信区间。平均 而言,这 1000 个后验均值应以事实为中心。平均而言,真 实参数值应在 95%的时间的可信区间内。 以下是这些评估的摘要。 ylab( ‘ ylab( ‘ Count+ g) gtitle( ‘ (true values in red) ) PosteDrisotrributions of Parameters “估计平均值 ”列是所有 1,000 个模拟中的平均后验平均值。 非常好。偏差百分比均小于 5%。对于所有参数, 95% CI 的 覆盖率约为 95%。 扩展我们可以对该模型进行许多扩展。例如,可以使用除正 态分布外的其他分布来适应不同类型的结果。例如,如果我 们有二元数据,则可以将其建模为: 然后在上放一个先验分布。这个想法将贝叶斯线性回归推广 到贝叶斯 GLM 。 在本文中概述的线性情况下,可以更灵活地对协方差矩阵建 模。相反,假设协方差矩阵是对角线且具有单个公共方差

文档评论(0)

dajiefude2 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档