- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本科毕业设计(论文)外文翻译译文
学生姓名: 王淑晶
院 (系): 计算机学院
专业班级: 计0702
指导教师: 黄全舟
完成日期: 2011 年 3 月 15 日
数学行为中的人工智能游戏
Behavioral Mathematics for Game AI
作者:DAVE MARK
起止页码:79—92页
出版日期:March 5, 2009
出版单位:Course Technology PTR
外文翻译译文:
理性与非理性行为
冯·诺依曼其中的一个问题,和其他人期望的对博弈论的应用,在这样做时人们有着合理的行为举止。并且总是试图选择最好的结果。我们可以在第5章中,从一些例子可以看出,这并非总是如此。通常,人们要么无法选择到最佳的选择,要么甚至不以任何理由来选择。结果导致地就是这样一个规范性决策理论和决策理论的描述有差别的原因。而这种有着一大截的差距在于非理性行为。
当然,试图找出那些行为是一个棘手的问题。而计算机只善于计算出理性行为的答案。一个非理性的想法但有合理的前瞻性的答案却完全是另一种伎俩。我们大多数人习惯于这样的概念,不合理的东西是需要避免的,甚至回避。然而,正如我们已经深入看到的那样,并且会继续探讨下去,非理性不仅仅是非常真实的,并且它是对行为的性质赋予了深度。
试图与非理性的行为走一起是一个重大的问题。无论如何,通常一个问题都只有一个正确的(即理性的)回答。但在非理性行为的解集中往往是很宽松的。这一切并不是说是否是“正确”的答案是需要看一切是不是很合理。但有些事情是完全错误的。
如果你记得在第1章中所说的,我所画的一幅可爱的猪的画。虽然我对猪的写照描写很容易但是不够完美。这在“piggishness” 的范围内是很好的。它没有第五条腿伸出在其背脊上,像鱼的背鳍一样。虽然不是十全十美,但它是合理的猪的形状。还有,实话来说,人们可以通过无穷个途径来描绘出猪,但只有一些他们挑选出来的数目会属于可接受的范围内,并且观察员才可以接受“看起来是猪的样子”。当然,其中有些可能是归类为“古怪的猪”,但仍是合理的,足够不与其他的弄混淆,比如说,一匹马,鬣鳞蜥,或鸭嘴兽(虽然鸭嘴兽本身是不易混淆的)的糊涂思想。
最后,在规范决策理论和效用最大化的算法中,它给我们提供了无结果的但“应该做”的答案。我们需要在研究的理性与理性的基础上再作补充,并且合理地再进行复制。
完全理性
由于非理性的是如此难以界定,而它实际上是从理性的顶尖来理解更加容易开始这一尝试。代理商说,有完善的理性行为,如果他们总是以最好的方式,这样做即使使他们必须进行广泛而难以的计算工作。
如果,通过实例的理论来说,我们要降低到一个简单的游戏空间,我们可以利用一字棋这样的游戏。正如我们在第1章中指出,我们是否想要赢,则选择在游戏中的任何一点,可用于缩小到一个房间中的决定。如果我们想赢,有一个明显的选择。如果我们不想赢,有一个同样显而易见的选择。因此,我们在一字棋中的成功是完全基于我们是否想获胜。玩家将始终发挥一个完全合理的正确的举措。如果我们选择甚至错误地发挥这些举措之一,我们将不再被认为是完全合理的。
完全理性的其他例子可以应用到第5章中的游戏中。谁是囚犯,没有任何其他信息知道,选择以出卖他的囚徒困境中的合作伙伴是展示了完美的合理性。是谁在最后的游戏通牒中给了最低限度和独裁者,体现了完全理性的行事方式。正如在把蛋糕切割出一半,以减少预期中暴露的贪婪给(而且完全理性的)其他玩家是完全合理的。即使是不论谁扮演了一个匹配几个便士的混合策略,以防止他的对手通风报信的模式是完全合理的。
如果存在最优解,完全理性的代理人会抓住每一次。还有什么能比如此还好呢?结果是完美的合理性有着严重的弱点,需要通过运行试驾来暴露出。为此,我们需要一个测试赛道,让我们可以看到完美的理性行动。
海盗游戏
最后通牒博弈是指两个人以其“要么接受,要么拉倒” 的有趣的像鸡那样的冲突的游戏。正如我们上面提到的,它也是一个多么完美的合理性,但可能也会导致一个极端的例子。以优良的解决方案来说,在这种情况下,需要给其他人提供最低限度的支付的可能性变得更加有趣。它可以推广到许多人,而海盗游戏确实就是这样的。
在海盗游戏中,我们将有一个合理的海盗号(在本例中,我们将使用五)。尽管我所希望的是要拿出真的很酷的海盗名字。我们将制定它们为A,B,C,D和E。字母绰号是可以真正帮助我们进行下一个问题,即海盗有严格的资历顺序:A优于B,谁又优于C,谁又优于D,而谁又优于E。
作为一个群体,5个海盗需找到100个金币,正
文档评论(0)