- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 计算机博弈原理与方法学概述 ;主要内容;原理与方法学涵义;2.1 棋类介绍与分类;典型棋类介绍 ;人们为什么喜欢下棋?;中国象棋(Chinese Chess);国际象棋(Chess);车:横冲直撞
马:不怕蹩腿
象:可以过河
王:每步一格,不受区域限制
王一旦被杀,即为输棋
后 = 车+象,威力最大
兵:第一步可以走两格,吃过路兵;之后前走斜吃
王车易位(长易位,短易位);兵升变
相对子力值 :Assigning the pawn a value of 1, the values of the other pieces are approximately as follows: knight 3, bishop 3, rook 5, and queen 9.;围棋(Go / I-Go);五子棋( FIR-Five In A Row );六子棋(Connect 6);一字棋;二虎棋;三通棋;点格棋(Dots and Boxes);苏拉卡尔塔( Surakarta);亚马逊(Yamazons);华容道——滑块类游戏;棋的分类;按兵种多少分类(Pieces);按着法分类(Move);日本将棋;按胜负判决分类(Win-Lose-Draw) ;2.2 计算机博弈的基本原理;状态演化方程: ;2.2.2 如何让计算机下棋? ;棋局状态展开示意图;;节点为局面,树枝为着法,根节点为当前局面,叶节点为展开相应深度的终点局面。
如果叶节点还不是能够给出胜-负-和的最终局面,则要进行叶节点评估(Evaluation)。以便从有利局面选择当前着法。这便是博弈搜索的职能。
搜索引擎根据极大-极小的搜索算法,找到对于本方而言最好的结局。然后找到最佳路径(Principal Variation – 主要变例),从而找到相应的根着法(Root Move),即是本轮搜索所要给出的当前着法。
不难看出,评估和搜索将成为博弈软件的重要部分。 ;计算机博弈软件的构成;2.3 棋局要素的数据结构;棋类要素的数字化;2.3.2 计算机博弈数字化原则与意义 ;2.3.3 哈希变换与哈希表 ;位棋盘(Bit Board) ;2.4 棋局评估;2.4.1 子力(Material) ;2.4.2 位置(Position) ;2.4.3 空间(Space) ;2.4.4 机动(Mobility) ;2.4.5 拍节(Tempo) ; 图2-6 一个受制于节拍的象棋棋局;2.4.6 威胁(Threat) ;2.4.7 形状(Shape) ;2.4.8 图案(Motif) ;2.4.9 棋局性能评估 ;2.5 博弈树展开与分析;2.5.1 着法生成的不同策略 ;2.5.2 走子类着法生成方法 ;2.5.3 添子类着法生成方法 ;2.5.4 博弈树展开与分析 ;2.6 计算机博弈求解的基本搜索方法;???化搜索与博弈搜索;宽度优先与深度优先;基本搜索策略——广度优先 (Breadth-first search);基本搜索策略——深度优先 (Depth-first search);2.6.2 极大极小搜索 ;MAX;MAX;广度优先极大极小搜索算法 ;深度优先极大极小搜索算法 ;2.6.3 Alpha-Beta搜索 ;MAX;在对博弈树采取深度优先的搜索策略时,从左路分枝的叶节点倒推得到某一层MAX节点的值,可表示到此为止得以“落实”的着法最佳值,记为α。
显然此值可作为MAX方着法指标的下界。
在搜索此MAX节点的其它子节点,即探讨另一着法时,如果发现一个回合(2步棋)之后评估值变差,即孙节点评估值低于下界α值,则便可以剪掉此枝(以该子节点为根的子树),即不再考虑此“软着”的延伸。
此类剪枝称为α剪枝。;MAX;剪枝效果差别很大;β-剪枝(1);同理,由左路分枝的叶节点倒推得到某一层MIN节点的值,可表示到此为止对方着法的钳制值,记为β。
显然此β值可作为MAX方无法实现着法指标的上界。
在搜索该MIN节点的其它子节点,即探讨另外着法时,如果发现一个回合之后钳制局面减弱,即孙节点评估值高于上界β值,则便可以剪掉此枝,即不再考虑此“软着”的延伸。
此类剪枝称为β剪枝。;β-剪枝(2);;需要指出的是;;博弈树搜索过程;2.6.4 负极大值搜索 ;MAX;负极大值算法(NegaMax algorithm) ;;2.6.5 基于蒙特卡洛模拟的博弈树搜索 ;MCTS的基本思想;蒙特卡洛树搜索通过迭代来一步步地扩展博弈树的规模,UCT树是不对称生长的,其生长顺序也是不能预知的。
它是根据子节点的性能指标导引扩展的方向,这一性能指标便是UCB值。
它表示在搜索过程中既要充分利用已有的知识,给胜率高的节点
您可能关注的文档
最近下载
- Rexroth lndraMotion MTX micro简明调试手册04版本.pdf VIP
- 海南省“三医联动一张网”项目建设工程招标(简称:海南省三医联动信 息平台)第三章用户需求书.PDF VIP
- 客户经理业绩考核分析系统数据库设计说明.doc
- 最新人教版一年级上册数语文同步练习册及单元试卷.doc VIP
- 人教版高中物理高考总复习全册知识点考点梳理、重点题型分类巩固练习提高版.doc VIP
- 人教版高中物理必修3基础知识自测小纸条(含答案及解析).pdf VIP
- GB50575-2010 1Kv及以下配线工程施工与验收规范.pdf VIP
- 食源性疾病事件应急处置桌面推演脚本.doc VIP
- 智慧校园智能学习环境对城市初中生创新思维培养的实证研究教学研究课题报告.docx
- 人教版高中物理选修3-5全册知识点考点梳理、重点题型分类巩固练习提高版.doc VIP
文档评论(0)