杰弗里的决策逻辑初探.doc

下载文档

9
0
约6.7千字
约 7页
2017-02-13 发布于重庆
举报
版权申诉
保障服务

杰弗里的决策逻辑初探.doc

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

杰弗里的决策逻辑初探

杰弗里的决策逻辑初探胡毅敏杰弗里（Richard Jeffrey）（1926~）是美国著名的逻辑学家，他在决策逻辑、归纳逻辑、形式逻辑、逻辑与计算机、机遇和可能性等方面都有深入的研究。他的专著《决策逻辑》在1965年出版，于1983和1990年两次进行了修订。在这部著作中，他介绍了决策逻辑的发展过程，在主观贝叶斯主义框架下，用逻辑和数学的方法构建了自己独特的决策理论，并对许多问题进行了哲学上的思考。因此，对杰弗里的决策逻辑思想的探讨是很有意义的。一、决策过程 1. 决策的一般过程决策逻辑主要研究风险型决策问题。在风险型决策的过程中，有两个因素起着决定性的作用。一是决策者无法控制的世界状态，二是决策者对某些行为在某个状态下可能产生的后果的主观估计。我们用概率（probability）来描述状态出现的可能性的大小，用期望（desirability）来描述后果在决策者心目中的价值。期望常由金钱、物品或其它事物来体现,也能用数值对它进行度量。决策者执行哪一种行为，需要对每种行为在所有状态下的后果作全面的考虑，我们可以通过计算每个行为的估计期望（estimated desirability）值，然后进行比较和抉择。一个行为的估计期是该行为所有后果的期望的加权和。其中，权数为每一后果所处状态的概率。（在国内的有关文献中常用“期望效用”描述“估计期望”）。这样，我们可以根据贝叶斯原则，选择执行具有最大估计期望的行为。设决策问题有n个行为：a1,a2,…an,可能的状态有m个：b1, b2,…, bm，第j种状态发生的概率为pj (j = 1, 2,…, m)，第i个行为 (i = 1, 2,…, n)在第j种状态下的期望为dij, ei表示第i个行为的估计期望。则 ei = (pjdij = p1di1(…(pmdim，利用这个公式，可以分别求出n个行为的估计期望值，我们选择执行那个具有最大估计期望值的行为。还可以把行为按照它们的估计期望值的由大到小顺序排序，建立行为的偏好等级。决策的原则是：执行具有最高偏好等级的行为之一。这个原则称为贝叶斯原则。一般地，在同一的决策过程中，状态的概率和后果的期望都是唯一的。 2. 古典决策理论在决策过程中，如果状态的概率是唯一的，后果的期望却不相同，一般来说可能产生不同的偏好等级。但也有特殊情况。当后果的期望以特殊方式相联系，在概率相同的条件下，它们产生的行为的偏好等级相同。古典决策理论的代表有蓝姆塞（F.P.Ramsey）和萨维奇（L.J.Savage）等。在古典决策理论中，后果的期望的联系方式是：一个期望值是另一个期望值的带有正系数的线性变换。具体地：设决策问题有n个行为：a1, a2,…, an，可能的状态有m个：b1, b2,…, bm，第j种状态发生的概率为pj (j = 1, 2,…, m)。第一种情况是，第i个行为(i= 1, 2,…, n)在第j种状态下的期望为dij，ei表示第i个行为的估计期望。第二种情况是，第i个行为(i = 1, 2,…, n)在第j种状态下的期望为Dij，Ei表示第i个行为的估计期望。这里，Dij与dij的关系为：Dij= adij(b (a是正数，b是实数)，则 ei= (pjdij= p1di1(…(pmdim, Ei = (pjDij = p1Di1(…(pmDim = p1(adi1(b)(…(pm(adim(b) = a(p1di1(…(pmdim)(b(p1(…(pm)。令b(p1(…(pm) = r，则Ei = aei(r。因为a 0，r为任意实数，所以，如果ek el，则必有Ek El；如果ek el，则必有Ek El；如果ek=el，则必有Ek= El(k = 1, 2,…, n，l = 1, 2,…, n)。故行为的偏好等级不会被期望值的这种变换打乱。由此，我们看到，一个期望标准可以用另一个期望标准代替而不改变行为的偏好等级。在一般的决策理论中，主观概率是对状态而言的，它是某个人对状态出现的一种相信程度；期望是对后果而言的，表明某个人对于后果的渴求程度。在决策逻辑中，我们将状态、后果和行为都作为命题来处理。用符号probA表示命题A的概率；用符号desA表示对命题A的期望，用表示命题A的否定，用AB表示命题A与B的合取，A(B表示命题A与B的析取。命题的合取和析取可以推广到两个命题以上的情况。用T表示必然命题，用F表示不可能命题。并且命题的概率和期望满足下面的概率公理和期望公理。概率公理： (a) 概率是非负的：probX(0。 (b) 概率是正常的：probT = 1。 (c) 概率是可加的：如果XY = F，则 prob(X(Y) = probX(probY。概率的可加性说明：如果命题X，Y互不