决策理论与方法 教学PPT 作者 罗党 第四章 动态决策分析.pptVIP

决策理论与方法 教学PPT 作者 罗党 第四章 动态决策分析.ppt

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
教材配套课件 * * * 教材配套课件 * * * 教材配套课件 * * * 教材配套课件 * * * 教材配套课件 * * * 教材配套课件 * * * §4.4 马尔可夫决策 已知: 问某人开始在第1部门工作,一年后在第2部门工作的概率是多少?一年后,技术人员在3个部门工作的概率各为多少? §4.4 马尔可夫决策 解:由状态1经过两次转移到状态2的所有途径为 1→1→2,1→2→2,1→3→2 记由状态i经两步转移到状态j的概率为  ,则: 若某人开始在第一部门工作,则一年后在第二部门工作的概率是50%。 §4.4 马尔可夫决策 解:记一年后技术人员在第j个部门工作的概率为Pj(2),则: 一年后,技术人员在3个部门工作的概率 §4.4 马尔可夫决策 由上例可看出 从而有 一般地,有 §4.4 马尔可夫决策 4.4.3 稳态概率 为稳态概率。 由于初始状态对n步转移后所处状态的影响随n增大而减少,故: 因此我们可以从n步转移矩阵的 极限取得稳态概率分布 称 §4.4 马尔可夫决策 得 且 此方程组称为稳态方程。 记 则 4.4.4 马尔可夫应用实例 例1 某生产商标为A的产品的厂商为了与另外两个生产同类产品B和C的厂家竞争,有三种可供选择的措施:(1)发放有奖债券;(2)开展广告宣传;(3)优质售后服务。三种方案分别实施以后,经统计调查可知,该类商品的市场占有率的转移矩阵分别是 该类商品的月总销售量为1000万件,每件可获利1元。另外,三种措施的成本费分别为150万,40万,30万。为长远利益考虑,生产商标为A的产品的厂商应该采取何种措施? 解:采取第一种措施的稳态概率 解得: 且 解:同理可解出采取第二、第三种措施的稳态概率分别为: 计算生产A的厂商采取三种方案的期望利润如下: 方案 市场占有率 期望毛利 (万元) 方案成本 (万元) 期望净利 (万元) (1) 2/3 666.67 150 516.67 (2) 19/34 558.83 40 518.83 (3) 6/11 545.45 30 515.45 因此生产A的厂商应采取的长期策略为方案(2)。 例2 我国出口某种设备,在国际市场上的销售状况有两种:畅销和滞销。畅销每年可以获利100万元,滞销时每年仅获利30万元。以一年为一个时期,如果不采用广告推广产品或采取广告措施,状态的转移矩阵分别如下 P1 畅销 滞销 畅销 0.8 0.2 滞销 0.4 0.6 不采取广告措施 采取广告措施 P2 畅销 滞销 畅销 0.9 0.1 滞销 0.7 0.3 例2 假定上一年处于畅销状态,每年的广告费为15万元。为了保证今后3年的利润最大化,是否应该采用广告措施? 解:(1)若不采取广告措施 上一年畅销情况下,三年的期望利润总和为: 例2 解:(1)若采取广告措施 上一年畅销情况下,三年的期望利润总和为: 因此,为使三年所获期望利润最大,在上一年畅销情况下,最满意的方案是不采取广告策略。 例2 上例中,若每年是否采取广告策略需要依据上一年的经营情况而定,应该如何决策? 解:这是一个三阶段决策问题。可画决策树,用逆序归纳法分析。 本章小结 本章介绍了动态决策的基本概念与基本方法,重点是:多阶段决策、序贯决策、决策树等概念,动态规划、决策树方法及其在多阶段决策、序贯决策中的应用。多阶段决策分为确定型与风险型两类,风险型问题要借助于概率以期望值最优为目标;序贯决策的关键是确定一个决策序列终止的原则。 * * * * * * * * * * * * * * * * * 教材配套课件 * * * 例4-2-2 决策:(1)购买专利; (2)不试销;   (3)大批生产a2。 购买专利总期望收益=2.7-1=1.7万元,大于不买技术的收益1.1万元,截去不买专利方案,结点1的值为1.7万元 。 试销收益期望值扣除试销费用5000元后小于不试销的收益值,截去试销方案,结点2的值为2.7万元。 第一阶段 1 2 7 买专利 不买专利 试销 不试销 3 4 5 6 H1 0.44 H2 0.39 H3 0.17 8 9 10 a1 a2 a3 0.818 0.136 0.046 (略) 第二阶段 第三阶段 例4-2-2 4万元 2万元 -3万元 1.1万元 3.406万 2.77万 1万 3.406万 2.62万 1.53万 2.78054万 -0.5万 2.7万 2.7万 -1万 1.7万 4.2 多阶段决策 4.2.2 多阶段决策问题的决策方法 例4-2-的决策树 买 不试 试 不买 8 4 9 3 5 6 7 2 1 本讲内容 4.3序贯决策 4.3.1序贯决策的基本概念

文档评论(0)

676200 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档