- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第五章马尔可夫决策已知产品A的销售总量为1000万件,每件可获利1元。另外,三种措施的成本费分别为150万,40万,30万。为长远利益考虑,生产产品A的厂家应该采取何种措施?练习2我国出口某种设备,在国际市场上的销售状况有两种:畅销和滞销。畅销每年可以获利100万元,滞销时每年仅获利30万元。以一年为一个时期,如果不采用广告推广产品或采取广告措施,状态的转移矩阵分别为如表1、表2所示。假定上一年处于畅销状态,每年的广告费为15万元。为了保证今后3年的利润最大化,是否应该采用广告措施?练习2我国出口某种设备,在国际市场上的销售状况有两种:畅销和滞销。畅销每年可以获利100万元,滞销时每年仅获利30万元。以一年为一个时期,如果不采用广告推广产品或采取广告措施,状态的转移矩阵分别为如表1、表2所示。假定上一年处于畅销状态,每年的广告费为15万元。为了保证今后3年的利润最大化,是否应该采用广告措施?练习3在上例中,如果每年是否采取广告措施可根据上一年的经营情况确定。那么,应该如何决策?0.60.4滞销0.20.8畅销滞销畅销0.30.7滞销0.10.9畅销滞销畅销表1不采取广告措施表2采取广告措施**马尔可夫决策一、基本概念定义1:任意一个行向量P=(p1,p2,…pn),如果满足:pi≥0(1in)及?pi=1,则向量P称为概率向量。定义2:一个n阶方阵A=(aij)如果满足:(1)aij≥0(2)?aij=1则称方阵为概率矩阵。j定理1:若A、B都为n阶概率矩阵,则A*B也是n阶概率矩阵。定理2:若A为n阶概率矩阵,K为任意正整数,则AK也是n阶概率矩阵。定义3:若A为n阶概率矩阵,而且存在一个正整数K,使矩阵AK没有零元素,则称A为正规概率矩阵。A=01B=101/21/21/21/2A2=1/21/21/43/4由于存在整数2,使得A2没有零元素,A为正规概率矩阵而Bm中第一行总有零元素存在,所以B不是正规概率矩阵。例如:定义4:设u为n维非零行向量,A是n阶方阵,如果uA=u,则称u为是n阶方阵A的不变向量。例:u=(2,-1)是A=21的不变向量。23设P是正规的概率矩阵,则定理3P有且仅有一个不变概率向量t,而且t的所有元素都为正数。定理4设u为任意一个概率向量,则向量序列up,up2,up3….趋近于不变概率向量t。考虑一个具有n个结果(状态)S1,S2,….Sn的系统,如果系统由状态Si变化到Sj,就称为系统的状态转移,其概率Pij就称为状态转移概率,简称转移概率。定义5(状态转移矩阵)由状态转移概率Pij(i=1,2,…n)(j=1,2,…n)构成的矩阵P=(Pij)叫状态转移矩阵。S1S2…..SnS1P11P12…..P1nP=S2P21P22…..P2n…..SnPn1Pn2…..Pnn定义6(r步状态转移概率)设系统由状态Si出发,经过r步状态转移到达状态Sj,称其概率Pij(r)为r步状态转移概率。定义7(r步状态转移矩阵)由r步状态转移概率Pij(r)构成的矩阵P(r)=(Pij(r))叫r步状态转移矩阵。定义8(马尔可夫过程)如果一个系统在状态转移过程中下一步处于什么状态与且仅与现在的状态有关,而与过去的状态无关,这种过程称为马尔可夫过程。性质:1P(r)=P(r-1)P2P(r)=Pr如果一个马尔可夫过程是正规的,即它的状态转移矩阵P是正规概率矩阵,那么系统一定能通过状态转移达到某一个稳定状态。设在稳定状态下,系统处于状态Si的概率为xi(i=1,2,…n),记X=(x1,x2….xn)通过求解联立方程组XP=X?xi=1可求出系统处于稳定状态的不变向量X。应用实例实例1:(市场占有率的预测)已知在某地区销售同类型产品的有A,B,C三个公司,经过一年营业后进行调查,发现:1A公司的200名顾客中有160名继续订货,有20名转向B公
您可能关注的文档
最近下载
- 降钙素原抗体产品技术要求标准2024年.pdf VIP
- 2013-2022同等学历申硕学位英语真题(含答案).pdf VIP
- 2023年全国职业院校技能大赛食品安全与质量检测题库1-10.docx VIP
- 内部培训刑法知识考试题库大全及答案下载.pdf VIP
- 2025至2030全球及中国车载摄像头模块组件行业项目调研及市场前景预测评估报告.docx
- 2023-2024学年安徽省合肥重点中学九年级(上)第一次月考道德与法治试卷.pdf VIP
- 人教版(2024新版)九年级上册化学全册教案教学设计.docx
- 中国油田分布明细-含分布图.docx VIP
- 6.4 酵母菌子囊孢子的观察(原理讲解).pdf VIP
- AIGC技术在非物质文化遗产设计保护中的应用探索 .pdf VIP
文档评论(0)