- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
杰弗里的决策逻辑初探
杰弗里的决策逻辑初探
胡 毅 敏
杰弗里(Richard Jeffrey)(1926~)是美国著名的逻辑学家,他在决策逻辑、归纳逻辑、形式逻辑、逻辑与计算机、机遇和可能性等方面都有深入的研究。他的专著《决策逻辑》在1965年出版,于1983和1990年两次进行了修订。在这部著作中,他介绍了决策逻辑的发展过程,在主观贝叶斯主义框架下,用逻辑和数学的方法构建了自己独特的决策理论,并对许多问题进行了哲学上的思考。因此,对杰弗里的决策逻辑思想的探讨是很有意义的。
一、决策过程
1. 决策的一般过程
决策逻辑主要研究风险型决策问题。在风险型决策的过程中,有两个因素起着决定性的作用。一是决策者无法控制的世界状态,二是决策者对某些行为在某个状态下可能产生的后果的主观估计。我们用概率(probability)来描述状态出现的可能性的大小,用期望(desirability)来描述后果在决策者心目中的价值。期望常由金钱、物品或其它事物来体现,也能用数值对它进行度量。决策者执行哪一种行为,需要对每种行为在所有状态下的后果作全面的考虑,我们可以通过计算每个行为的估计期望(estimated desirability)值,然后进行比较和抉择。一个行为的估计期是该行为所有后果的期望的加权和。其中,权数为每一后果所处状态的概率。(在国内的有关文献中常用“期望效用”描述“估计期望”)。这样,我们可以根据贝叶斯原则,选择执行具有最大估计期望的行为。
设决策问题有n个行为:a1,a2,…an,可能的状态有m个:b1, b2,…, bm,第j种状态发生的概率为pj (j = 1, 2,…, m),第i个行为 (i = 1, 2,…, n)在第j种状态下的期望为dij, ei表示第i个行为的估计期望。则
ei = (pjdij = p1di1(…(pmdim,
利用这个公式,可以分别求出n个行为的估计期望值,我们选择执行那个具有最大估计期望值的行为。还可以把行为按照它们的估计期望值的由大到小顺序排序,建立行为的偏好等级。决策的原则是:执行具有最高偏好等级的行为之一。这个原则称为贝叶斯原则。
一般地,在同一的决策过程中,状态的概率和后果的期望都是唯一的。
2. 古典决策理论
在决策过程中,如果状态的概率是唯一的,后果的期望却不相同,一般来说可能产生不同的偏好等级。但也有特殊情况。当后果的期望以特殊方式相联系,在概率相同的条件下,它们产生的行为的偏好等级相同。
古典决策理论的代表有蓝姆塞(F.P.Ramsey)和萨维奇(L.J.Savage)等。在古典决策理论中,后果的期望的联系方式是:一个期望值是另一个期望值的带有正系数的线性变换。具体地:
设决策问题有n个行为:a1, a2,…, an,可能的状态有m个:b1, b2,…, bm,第j种状态发生的概率为pj (j = 1, 2,…, m)。第一种情况是,第i个行为(i= 1, 2,…, n)在第j种状态下的期望为dij,ei表示第i个行为的估计期望。第二种情况是,第i个行为(i = 1, 2,…, n)在第j种状态下的期望为Dij,Ei表示第i个行为的估计期望。这里,Dij与dij的关系为:Dij= adij(b (a是正数,b是实数),则
ei= (pjdij= p1di1(…(pmdim,
Ei = (pjDij = p1Di1(…(pmDim
= p1(adi1(b)(…(pm(adim(b)
= a(p1di1(…(pmdim)(b(p1(…(pm)。
令b(p1(…(pm) = r,则Ei = aei(r。因为a 0,r为任意实数,所以,如果ek el,则必有Ek El;如果ek el,则必有Ek El;如果ek=el,则必有Ek= El(k = 1, 2,…, n,l = 1, 2,…, n)。
故行为的偏好等级不会被期望值的这种变换打乱。
由此,我们看到,一个期望标准可以用另一个期望标准代替而不改变行为的偏好等级。
在一般的决策理论中,主观概率是对状态而言的,它是某个人对状态出现的一种相信程度;期望是对后果而言的,表明某个人对于后果的渴求程度。在决策逻辑中,我们将状态、后果和行为都作为命题来处理。用符号probA表示命题A的概率;用符号desA表示对命题A的期望,用表示命题A的否定,用AB表示命题A与B的合取,A(B表示命题A与B的析取。命题的合取和析取可以推广到两个命题以上的情况。用T表示必然命题,用F表示不可能命题。并且命题的概率和期望满足下面的概率公理和期望公理。
概率公理:
(a) 概率是非负的:probX(0。
(b) 概率是正常的:probT = 1。
(c) 概率是可加的:如果XY = F,则
prob(X(Y) = probX(probY。
概率的可加性说明:如果命题X,Y互不
文档评论(0)