决策理论与方法教学PPT 作者罗党第四章动态决策分析.pptVIP

下载本文档

4
0
约1.1万字
约 74页
2019-09-23 发布于湖北
举报
版权申诉

决策理论与方法教学PPT 作者罗党第四章动态决策分析.ppt

1、本文档共74页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

教材配套课件 * * * 教材配套课件 * * * 教材配套课件 * * * 教材配套课件 * * * 教材配套课件 * * * 教材配套课件 * * * §4.4　马尔可夫决策已知：问某人开始在第1部门工作，一年后在第2部门工作的概率是多少？一年后，技术人员在3个部门工作的概率各为多少？ §4.4　马尔可夫决策解：由状态1经过两次转移到状态2的所有途径为 1→1→2，1→2→2，1→3→2 记由状态i经两步转移到状态j的概率为　，则：若某人开始在第一部门工作，则一年后在第二部门工作的概率是50%。 §4.4　马尔可夫决策解：记一年后技术人员在第j个部门工作的概率为Pj(2)，则：一年后，技术人员在3个部门工作的概率 §4.4　马尔可夫决策由上例可看出从而有一般地，有 §4.4　马尔可夫决策 4.4.3　稳态概率为稳态概率。由于初始状态对n步转移后所处状态的影响随n增大而减少，故：因此我们可以从n步转移矩阵的极限取得稳态概率分布称 §4.4　马尔可夫决策得且此方程组称为稳态方程。记则 4.4.4 马尔可夫应用实例例1 某生产商标为A的产品的厂商为了与另外两个生产同类产品B和C的厂家竞争，有三种可供选择的措施：(1)发放有奖债券；(2)开展广告宣传；(3)优质售后服务。三种方案分别实施以后，经统计调查可知，该类商品的市场占有率的转移矩阵分别是该类商品的月总销售量为1000万件，每件可获利1元。另外，三种措施的成本费分别为150万，40万，30万。为长远利益考虑，生产商标为A的产品的厂商应该采取何种措施？解：采取第一种措施的稳态概率解得：且解：同理可解出采取第二、第三种措施的稳态概率分别为：计算生产A的厂商采取三种方案的期望利润如下：方案市场占有率期望毛利 (万元) 方案成本 (万元) 期望净利 (万元) (1) 2/3 666.67 150 516.67 (2) 19/34 558.83 40 518.83 (3) 6/11 545.45 30 515.45 因此生产A的厂商应采取的长期策略为方案(2)。例2 我国出口某种设备，在国际市场上的销售状况有两种：畅销和滞销。畅销每年可以获利100万元，滞销时每年仅获利30万元。以一年为一个时期，如果不采用广告推广产品或采取广告措施，状态的转移矩阵分别如下 P1 畅销滞销畅销 0.8 0.2 滞销 0.4 0.6 不采取广告措施采取广告措施 P2 畅销滞销畅销 0.9 0.1 滞销 0.7 0.3 例2 假定上一年处于畅销状态，每年的广告费为15万元。为了保证今后3年的利润最大化，是否应该采用广告措施？解：(1)若不采取广告措施上一年畅销情况下，三年的期望利润总和为：例2 解：(1)若采取广告措施上一年畅销情况下，三年的期望利润总和为：因此，为使三年所获期望利润最大，在上一年畅销情况下，最满意的方案是不采取广告策略。例2 上例中，若每年是否采取广告策略需要依据上一年的经营情况而定，应该如何决策？解：这是一个三阶段决策问题。可画决策树，用逆序归纳法分析。本章小结本章介绍了动态决策的基本概念与基本方法，重点是：多阶段决策、序贯决策、决策树等概念，动态规划、决策树方法及其在多阶段决策、序贯决策中的应用。多阶段决策分为确定型与风险型两类，风险型问题要借助于概率以期望值最优为目标；序贯决策的关键是确定一个决策序列终止的原则。 * * * * * * * * * * * * * * * * * 教材配套课件 * * * 例4-2-2 决策：（1）购买专利；（2）不试销；　（3）大批生产a2。购买专利总期望收益＝2.7－1＝1.7万元，大于不买技术的收益1.1万元，截去不买专利方案，结点1的值为1.7万元。试销收益期望值扣除试销费用5000元后小于不试销的收益值，截去试销方案，结点2的值为2.7万元。第一阶段 1 2 7 买专利不买专利试销不试销 3 4 5 6 H1　0.44 H2 0.39 H3 0.17 8 9 10 a1 a2 a3 0.818 0.136 0.046 （略）第二阶段第三阶段例4-2-2 4万元 2万元－3万元 1.1万元 3.406万 2.77万 1万 3.406万 2.62万 1.53万 2.78054万 -0.5万 2.7万 2.7万 -1万 1.7万 4.2 多阶段决策 4.2.2 多阶段决策问题的决策方法例4-2-的决策树买不试试不买 8 4 9 3 5 6 7 2 1 本讲内容 4.3序贯决策 4.3.1序贯决策的基本概念

您可能关注的文档

文档评论（0）

676200 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

决策理论与方法教学PPT 作者罗党第四章动态决策分析.pptVIP