动态决策问题研究及其应用现状评述.docVIP

下载本文档

67
0
约9.7千字
约 18页
2018-08-24 发布于福建
举报
版权申诉

动态决策问题研究及其应用现状评述.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

动态决策问题研究及其应用现状评述

动态决策问题研究及其应用现状评述　　［内容摘要］根据动态决策问题的研究方法及类型，本文对解决动态决策问题的最优解策略和启发式策略进行了分析与评述，而且进一步梳理了多属性动态决策问题、决策目标变化的动态决策问题以及动态决策问题的应用现状。研究结果显示，当前对于动态决策的探索越来越关注决策者的启发式策略、而非最优解策略，越来越强调选择策略的满意性和适应性原则、而非最优性与规范性原则。　　［关键词］动态决策；最优解策略；启发式策略；研究评述。　　［作者简介］李俊岭，河北工业大学博士研究生，主要从事决策科学理论与应用研究。　　刘庆顺，河北经贸大学公共管理学院副教授，主要从事管理决策研究。　　　　一、动态决策及其问题描述　　　　现实生活中，许多关于决策任务的信息并非一次性全部出现，而是随着时间的推移依次到来。比如股票投资决策，股价是随着时间的推移而序次出现，每次出现一个价格之后你就要决定是否出售或买进。每次进行决策时，出于决策收益最大化原则你很想知道后面还会有哪些价位会出现。因此，你会采取一种边观察边等待最优价格出现的策略，在这个过程中需要你“决定”何时停止观察股价、何时进行出售或买进。一般来说，这种备选项序次出现的情境被称为动态决策，而将备选项全部一次性出现的情境称为静态决策①。　　实际上，静态决策现象从严格意义上来说不是一个“决策”问题。这是因为，决策问题涉及到判断与选择两个方面，而静态决策只是一个“选择”问题，不需要人们较多的认知努力以及较强的信息加工能力。因此，现实生活中的静态决策问题非常少，人们通常遇到的大多是动态决策情境。对于有些序贯决策问题，由于在时间上有先后之别的多阶段决策组成，也称为动态决策。各阶段采取的决策一般是与时间或空间有关，决策既依赖于当前的状态又引起当前状态的变化，前一阶段的决策方案直接影响到后一阶段决策方案的选择。　　已有关于动态决策的研究成果，从其研究方法的角度可以分为规范性研究与描述性研究两大类。其中，规范性研究主要是运用理论求解的方法寻求最优决策，其研究成果主要是论证了动态决策的最优停止时间以及最优决策的收益，这方面的研究主要集中在应用数学、统计学、运筹学等领域。而描述性研究主要是运用实证研究的方法，探讨决策者在动态过程中的行为特征与规律，这方面的研究主要集中在心理学、经济学、管理学等领域。本文将主要基于动态决策的研究方法视角，对相关的研究文献进行梳理与分析，研究的重点集中于当前国内外关于动态决策的最优解策略研究以及满意解策略的研究。同时，本文也将探讨国内外关于多属性动态决策以及动态决策应用的最新研究动态。　　　　二、动态决策问题的最优解策略研究　　　　早在20世纪60年代，Lindley②就论证了解决动态决策问题的一种最优解策略。该策略的基本步骤是首先确定一个动态搜索截止点，然后拒绝截止点前面所有已经观察过的选项，而接受此后出现的第一个优于前面所有选项的那个选项。通过理论推导与计算，该截止阀值为r*－1（r*是迄今为止已经观察过的选项数量），而且当n→∞时r*＝1/e×n。而且如此选择，能够保证决策者选中最优选项的概率最大，这个概率接近1/e≈37％。　　显而易见，最优解策略的决策目标就是寻求最优，而且它也准确刻画出如何达到最优的选择方法。不过，阀值的确定则需要决策者具有较强的计算能力与较多的认知努力。而这些能力，在决策时间比较短、决策情形比较急迫的情境下对于决策者来说则提出了很高的要求，有时候甚至是不可能的。比如救火现场的消防指挥官，他不可能有能力、有时间进行充分的计算，然后才决定采取何种救火措施。　　因此，后来的许多研究者发现（如Stewart③），上述关于动态决策问题的假设条件相比较现实决策情境来说过于严格。比如：公司招聘往往是存在若干个招聘岗位，而且应聘者经常会反悔（即违约）。尤其是，由于人们很明白最求最优选择的目标很难达到，因此往往放弃最优选择的决策目标，而进行满意选择。那么，在这种情况下许多研究者通过松弛动态决策问题的假设条件，进一步改进与调整了Lindley的最优截止阀策略。　　比如决策目标的变化。在招聘秘书或选择结婚对象等情境的决策问题中，决策目标是选择其中最优秀的一个。然而，这个决策目标是动态决策情境中前提条件最为严格的一个。这是因为，现实中的决策者通常很难命中其中的最优秀者。因此，后来的许多研究对决策目标进行了一定程度上的松弛。　　Gilbert和Mosteller④研究了决策者的目标是选择k个最好选项之中的一个（k＞1，而且这k个选项之间没有报酬上的差异）。Kawaim和Tamaki⑤则具体探讨了决策者只要选中n个选项中的最优或次优就为“赢”的情境，其中n为一个随机变量且决策者知道其分布函数（即