基于BDI推理模型麻将游戏机器人设计.docVIP

  • 36
  • 0
  • 约5.38千字
  • 约 12页
  • 2018-08-27 发布于福建
  • 举报

基于BDI推理模型麻将游戏机器人设计.doc

基于BDI推理模型麻将游戏机器人设计

基于BDI推理模型麻将游戏机器人设计   摘 要:在分析麻将游戏基本规则的基础上,引入BDI推理模型,构建了一种麻将游戏机器人结构,介绍了对机器人信念、愿望、目标等元素的实现,并提出一种游戏中机器人的使用策略,为不同规则的麻将游戏机器人开发提供参考。   关键词:BDI推理模型;麻将;游戏机器人   DOIDOI:10.11907/rjdk.171235   中图分类号:TP319   文献标识码:A 文章编号:1672-7800(2017)007-0090-03   0 引言   麻将游戏深受人们喜爱,网络载体的麻将游戏有着广泛的群众基础,设计能够与玩家互动的麻将游戏机器人具有广阔的应用前景。作为真实玩家的对手,机器人的表现直接影响着游戏的趣味性,由于机器人是计算机操控的角色,开发人员可以为机器人赋予真人玩家没有的能力,例如获取别的玩家手中牌的信息。受商业元素影响,为了缩短产品开发周期,这种作弊手段在现有网络麻将游戏开发中常常用到。该开发方法有一定优势,但与真实世界的脱离会降低玩家对游戏的认同感,进而影响市场占有率,故不可取。BDI模型已经被证实符合正常人的推理思维,因此,设计基于BDI推理模型的麻将游戏机器人是很好的选择。   1 BDI推理模型   20世纪80年代,M E Bratman[1]在斯坦福大学的理性Agent项目研究中提出了信念―愿望―意图(Belief-Desire-Intention,BDI)模型。在Bratman工作的基础上,Cohen和Levesque[2]构建了基于正规模态逻辑的BDI模型,而Rao和Georgeff[3]则采用计算树逻辑对BDI模型的组成与推理作了更详细的刻画。BDI模型结构是慎思型Agent的主要结构,信念、愿望、意图是Agent的3种心智状态。信念是Agent对世界的认知,代表着对获得信息的一种评价;愿望是Agent希望达到的一种事件状态,是Agent的一些可选目标集合,并且这些目标可以是相互冲突的;意图是Agent当前想要达到的工作状态,可以是愿望中的一个。BDI推理过程如图1 所示。   目前,关于BDI推理模型的研究方法主要有两种,一是基于逻辑系统对BDI推理模型的研究和扩展[4],二是从应用角度利用BDI推理模型进行仿真研究[5]和实用系统开发[6]。仿真研究多借助于现有成熟的仿真平台,如Netlog、Jade、Jack等,实用系统的开发多基于现有的开发平台,如Microsoft Agent。   BDI模型符合正常人的思维过程,但BDI模型只提供一个抽象的模式化结构,在具体应用中如何将BDI推理模型中抽象的组成实例化是开发工作人员面临的问题,麻将游戏机器人的设计也不例外。   2 麻将游戏机器人建模   2.1 麻将游戏基本规则   各地的麻将游戏融合了当地人的智慧,规则略显不同,但具有通用的麻将游戏基本规则。麻将按花色分为条万筒3种序数牌、东西南北4种风字牌,以及中发白3种箭牌。每种序数牌由1到9组成,共27种,每种牌有4张,整副牌共(3*9+4+3)*4=136张。玩家共有4人,开局后每个玩家分发13张牌。从庄家开始,获得牌权的玩家做动作,获得牌权的方式有顺序获取、碰、吃、杠4种。获得牌权的玩家如果手中牌的数目除以3余1,则先从牌堆中取出一张,然后出牌,直至赢牌或者牌堆剩余数目低于约定数目(一般为1)。   赢牌牌型必须符合m*AAA+n*ABC+DD的形式,其中m、n可以为0 。玩家游戏的过程可以描述为通过不断替换手中的牌,直至达到赢牌状态。   麻将游戏是棋牌类游戏的代表,棋牌游戏具有离散事件、动态系统的特点,其状态变化均发生在离散的时间点[7]。麻将游戏的参与者都要遵守游戏规则,机器人也不例外,故机器人的行为是受限的,其做出的每一个行为都要包含于有限的可选动作集中。   2.2 机器人结构建模   图2为根据BDI推理模型构建的机器人结构,感知器捕获触发此机器人的消息,并更新记忆库和行为集;状态集存储机器人对当前牌局的认识,是形成目标的依据;记忆库表示机器人对已经发生的事件的记忆,包含自己手中牌、玩家已出牌、不确定牌,其中不确定牌可能在牌堆中,也可能在别的玩家手中;规则库则存储牌局规则,如赢牌的判断方法;行为集中为当前机器人可以执行的行为提示,如吃牌、杠牌、出牌,机器人的行为必须从行为集中选择;更新器负责根据当前状态集、记忆库以及规则更新目标集和状态集。目标为Agent可以达到的某种理想状态,目标集中有多个目标,每个目标的实现难度不同,有的永远不能实现。筛选器对目标集进行筛选,得到一个或一组具有共性的目标;分解器根据策略进行目标分解,得到诸多可一步达到的状态,存入意图集;最后匹配器将行为集中的行为与意图集中的意图相匹配

文档评论(0)

1亿VIP精品文档

相关文档