67.马尔科夫链最全讲义.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

递推方法计算概率与一维马尔科夫过程

一.基本原理

1.转移概率:对于有限状态集合,定义:为从状态到状态的转移概率.

2.马尔可夫链:若,即未来状态只受当前状态的影响,与之前的无关.

3.完备事件组:如果样本空间中一组事件组符合下列两个条件:

(1);

(2).

则称是的一个完备事件组,也称是的一个分割.

4.全概率公式:设是一个完备事件组,则有

5.一维随机游走模型,即:设数轴上一个点,它的位置只能位于整点处,在时刻时,位于点,下一个时刻,它将以概率或者

()向左或者向右平移一个单位.若记状态表示:在时刻该点位于位置,那么由全概率公式可得:

另一方面,由于,代入上式可得:

.

进一步,我们假设在与处各有一个吸收壁,当点到达吸收壁时被吸收,不再游走.于是,.随机游走模型是一个典型的马尔科夫过程.

进一步,若点在某个位置后有三种情况:向左平移一个单位,其概率为,原地不动,其概率为,向右平移一个单位,其概率为,那么根据全概率公式可得:

有了这样的理论分析,下面我们看全概率公式及以为随机游走模型在2019年全国1卷中的应用.

二.典例分析

例1.(2023·新高考1卷)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若末命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.

(1)求第2次投篮的人是乙的概率;

(2)求第次投篮的人是甲的概率;

(3)已知:若随机变量服从两点分布,且,则.记前次(即从第1次到第次投篮)中甲投篮的次数为,求.

解析:(1)记“第次投篮的人是甲”为事件,“第次投篮的人是乙”为事件,

所以,

.

(2)设,依题可知,,则

即,构造等比数列,设,解得,则,又,所以是首项为,公比为的等比数列,即.

(3)因为,,所以当时,,故.

例2.(23届杭州二模)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是…,,,,,…,那么时刻的状态的条件概率仅依赖前一状态,即.

现实生活中也存在着许多马尔科夫链,例如著名的赌徒模型.

假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为,且每局赌赢可以赢得1元,每一局赌徒赌输的概率为,且赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B元,赌徒停止赌博.记赌徒的本金为,赌博过程如下图的数轴所示.

当赌徒手中有n元(,)时,最终输光的概率为,请回答下列问题:

(1)请直接写出与的数值.

(2)证明是一个等差数列,并写出公差d.

(3)当时,分别计算,时,的数值,并结合实际,解释当时,的统计含义.

解析:(1)当时,赌徒已经输光了,因此.当时,赌徒到了终止赌博的条件,不再赌了,因此输光的概率.

(2)记M:赌徒有n元最后输光的事件,N:赌徒有n元上一场赢的事件,

,即,

所以,所以是一个等差数列,设,则,累加得,故,得,

(3),由得,即,当时,,当时,,当时,,因此可知久赌无赢家,

即便是一个这样看似公平的游戏,只要赌徒一直玩下去就会的概率输光.

例3.(2023广东茂名二模)马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第次的状态有关,与第次状态是“没有任何关系的”.现有甲、乙两个盒子,盒子中都有大小、形状、质地相同的2个红球和1个黑球.从两个盒子中各任取一个球交换,重复进行次操作后,记甲盒子中黑球个数为,甲盒中恰有1个黑球的概率为,恰有2个黑球的概率为.

(1)求的分布列;

(2)求数列的通项公式;

(3)求的期望.

解析:(1)由题可知,的可能取值为0,1,2.由相互独立事件概率乘法公式可知:

;;,

故的分布列如下表:

0

1

2

(2)由全概率公式可知:

即:,所以,所以,

又,所以,数列为以为首项,以为公比的等比数列,所以,即:.

(3)由全概率公式可得:

,

即:,又,所以,

所以,又,

所以,所以,所以,

所以.

例4.足球是一项大众喜爱的运动.2022卡塔尔世界杯揭幕战将在2022年11月21日打响,决赛定于12月18日晚进行,全程为期28天.

校足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能的将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第次触球者是甲的概率记为,即.

(1)求(直接写出结果即可);

(2)证明:数列为等比数列,并判断第19次与第20

文档评论(0)

hyqhyqhyq616 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档