《随时确定性的随机连续时间马尔可夫过程.docVIP

《随时确定性的随机连续时间马尔可夫过程.doc

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《随时确定性的随机连续时间马尔可夫过程

电 子 商 务 信 息 管 理 专业:电子商务 班级:1333班 姓名:李瑞平 学号:201321102330 随时确定性的随机连续时间马尔可夫过程 厄尔布斯拉 加州大学河滨分校 基督教r谢尔顿 加州大学河滨分校 摘要 我们描述一个随机确定性方法、计算过滤和平滑分布,在大型variable-based连续时间马尔可夫的变化过程。之前,不随机算法,收敛到真实的极限分布,无限的计算时间。当内部使用的期望导致不稳定,抽样算法可以给不同的结果每次运行最大化或其他算法。我们的方法,结合了随时收敛的性质,与随机收敛的性质,与随机抽样杂文集一一的性质操作方法。它是建立在一个时间允许订购产品的扩张矩阵前,我们证明我们的方法形式比当前最好的抽样方法对基准问题。 连续随机系统 连续系统离散状态随机模型描述系统的事件时间不同步于全局时钟。例如:网页搜索(gvnawar-达纳etal,2012),计算机网络(徐、谢尔顿.2010).社交网络(风扇、谢尔顿2009)。机器人技术(Ngetal.2005),系统验证(Baier etal;2003)以及系统发育树(Cohn,etal,2009)等等。离散化时间可以计算昂贵,这个“分配”宽度必须比美国东部事件之间的时间短的多。这可能导致低效的com-pntation事件或预期的事件的时期不太频繁,很多像表示“状态”的数值算法。(浮点而及其实现比定点表示)在发展数值算法中是有用的,连续时间对随机动系统来说是有用的。 本文重点是马尔可夫的模型,一个离散时间马尔可夫过程,row-stochastil矩阵M和分布V(作为一个行向量)的计算。素食新闻=xmn向前传播n次步骤,在一个连续时间马尔可夫过程(CTMP)率(一紧张度)矩阵Q,Vt=VeQt。单位以相同的方法向前传播,这是在计算一步过滤平滑和参数估计中的关键,当V的规模很大,结构(al-v和问降低他们的效率表示)我们关注如何计算这个矩阵指数。 除了最简单的情况下,Vt内部没有真正的;特别是在由联合作业的假设状态空间分解下的状态变量,即使V是完全独立的,Vt不再有任何结构(除非Q也代表了一种完全的影响系统),这是同样的问题出现在dy-向前运动的贝叶斯网络(DNNS)propa-gation导致耦合系统中的所以变量,我们假设一个完整的分布状态空间太大的存储,因此寻求一个近似。 1.1以前的工作 这个问题在消失的decision-diagram-base表示强度矩阵Q得到关注,然而,这背后的假设文学是,尽管Q可能保持代表,需要一个确切的答案,因此,Vt表示为一个完整的向量,随机算法是其中之一,例如(费尔南德etal;1998). 相比之下,我们假设代表Vt明确不可能的,我们将要对分销Vt进行预期计算。在我们的方法中,我们共同在连续时间贝叶斯网络(Nodelman Centrate-etal;2002),(CTBNS)。但该方法一般针对任何Q的克罗内克产品的总和,即使最简单的期望(如边界)是计算(np困难证据证明的是一个简单的扩展贝叶斯网络),所以我们关注近似。在文献丁腈,有许多这样的方法,大致分为两组。第一个是变分方法如预期传播(El-Hay et al .,2010)和平均场(科恩et al .,2009)。这些方法是确定的。然而,他们不收敛真正价值随着计算时间增加,一般只计算边界或类似的期望。美国证券交易委员会(sec)-作为集团包括重要性抽样方法抽样(风扇et al .,2010)和吉布斯抽样(Rao 起来,2011)。这些方法收敛到真值并且可以估计任何期望的vt。然而,随机内使用时,这会产生问题算法(如expectation-maximization)。 1.2我们的方法 我们建议的方法是确定性和收敛限制的无限的计算时间。它可以被视为一个抽样和确定性方法之间的桥梁。我们将系统分解成两个部分:一个系统(一个)完全独立的组件,修正(B)。我们关于系统的确切原因和添加增加修正条款来源于B。我们生成一个计算树遍历它使用一个优先级队列,选择较大的修正条款。我们首先假设问和proba——提出我们的方法性向量可以存储。然后,我们将演示如何进行有效地计算时问吗是结构化的。在2.4节中,我们提出一个简单的例子地面派生。最后我们展示结果比较我们的方法的计算效率其他任何时候收敛的方法。 矩阵指数的计算 考虑一个CTMP和离散状态描述由一个初始状态分布行向量的大小n和vn-by-n率矩阵Q的大小。率矩阵表示的利率系统状态之间的转换。过渡的速度从我j qij 0和状态过渡的状态我是气的速度= Pj qij。的率矩阵的对角元素是消极的

文档评论(0)

haha85864 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档