计算机博弈原理与方法学概述.ppt

下载文档

18
0
约2.2千字
约 89页
2021-11-16 发布于广东
举报
版权申诉
保障服务

计算机博弈原理与方法学概述.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第二章计算机博弈原理与方法学概述 ;主要内容;原理与方法学涵义;2.1 棋类介绍与分类;典型棋类介绍 ;人们为什么喜欢下棋？;中国象棋（Chinese Chess）;国际象棋（Chess）;车：横冲直撞马：不怕蹩腿象：可以过河王：每步一格，不受区域限制王一旦被杀，即为输棋后 = 车+象，威力最大兵：第一步可以走两格，吃过路兵；之后前走斜吃王车易位（长易位，短易位）；兵升变相对子力值：Assigning the pawn a value of 1, the values of the other pieces are approximately as follows: knight 3, bishop 3, rook 5, and queen 9.;围棋（Go / I-Go）;五子棋（ FIR-Five In A Row ）;六子棋（Connect 6）;一字棋;二虎棋;三通棋;点格棋（Dots and Boxes）;苏拉卡尔塔（ Surakarta）;亚马逊（Yamazons）;华容道——滑块类游戏;棋的分类;按兵种多少分类（Pieces）;按着法分类（Move）;日本将棋;按胜负判决分类（Win-Lose-Draw） ;2.2 计算机博弈的基本原理;状态演化方程： ;2.2.2 如何让计算机下棋？ ;棋局状态展开示意图;;节点为局面，树枝为着法，根节点为当前局面，叶节点为展开相应深度的终点局面。如果叶节点还不是能够给出胜-负-和的最终局面，则要进行叶节点评估（Evaluation）。以便从有利局面选择当前着法。这便是博弈搜索的职能。搜索引擎根据极大-极小的搜索算法，找到对于本方而言最好的结局。然后找到最佳路径（Principal Variation – 主要变例），从而找到相应的根着法（Root Move），即是本轮搜索所要给出的当前着法。不难看出，评估和搜索将成为博弈软件的重要部分。 ;计算机博弈软件的构成;2.3 棋局要素的数据结构;棋类要素的数字化;2.3.2 计算机博弈数字化原则与意义 ;2.3.3 哈希变换与哈希表 ;位棋盘（Bit Board） ;2.4 棋局评估;2.4.1 子力(Material) ;2.4.2 位置(Position) ;2.4.3 空间(Space) ;2.4.4 机动(Mobility) ;2.4.5 拍节(Tempo) ; 图2-6 一个受制于节拍的象棋棋局;2.4.6 威胁(Threat) ;2.4.7 形状(Shape) ;2.4.8 图案(Motif) ;2.4.9 棋局性能评估 ;2.5 博弈树展开与分析;2.5.1 着法生成的不同策略 ;2.5.2 走子类着法生成方法 ;2.5.3 添子类着法生成方法 ;2.5.4 博弈树展开与分析 ;2.6 计算机博弈求解的基本搜索方法;???化搜索与博弈搜索;宽度优先与深度优先;基本搜索策略——广度优先（Breadth-first search）;基本搜索策略——深度优先（Depth-first search）;2.6.2 极大极小搜索 ;MAX;MAX;广度优先极大极小搜索算法 ;深度优先极大极小搜索算法 ;2.6.3 Alpha-Beta搜索 ;MAX;在对博弈树采取深度优先的搜索策略时，从左路分枝的叶节点倒推得到某一层MAX节点的值，可表示到此为止得以“落实”的着法最佳值，记为α。显然此值可作为MAX方着法指标的下界。在搜索此MAX节点的其它子节点，即探讨另一着法时，如果发现一个回合（2步棋）之后评估值变差，即孙节点评估值低于下界α值，则便可以剪掉此枝（以该子节点为根的子树），即不再考虑此“软着”的延伸。此类剪枝称为α剪枝。;MAX;剪枝效果差别很大;β-剪枝（1）;同理，由左路分枝的叶节点倒推得到某一层MIN节点的值，可表示到此为止对方着法的钳制值，记为β。显然此β值可作为MAX方无法实现着法指标的上界。在搜索该MIN节点的其它子节点，即探讨另外着法时，如果发现一个回合之后钳制局面减弱，即孙节点评估值高于上界β值，则便可以剪掉此枝，即不再考虑此“软着”的延伸。此类剪枝称为β剪枝。;β-剪枝（2）;;需要指出的是;;博弈树搜索过程;2.6.4 负极大值搜索 ;MAX;负极大值算法（NegaMax algorithm） ;;2.6.5 基于蒙特卡洛模拟的博弈树搜索 ;MCTS的基本思想;蒙特卡洛树搜索通过迭代来一步步地扩展博弈树的规模，UCT树是不对称生长的，其生长顺序也是不能预知的。它是根据子节点的性能指标导引扩展的方向，这一性能指标便是UCB值。它表示在搜索过程中既要充分利用已有的知识，给胜率高的节点

您可能关注的文档

文档评论（0）

清风老月 + 关注: 官方认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

认证主体阳春市惠兴图文设计有限公司

IP属地广东

统一社会信用代码/组织机构代码: 91441781MA53BEWA2D

1亿VIP精品文档

更多 >

计算机博弈原理与方法学概述.ppt