基于BDI推理模型麻将游戏机器人设计.docVIP

下载本文档

36
0
约5.38千字
约 12页
2018-08-27 发布于福建
举报

基于BDI推理模型麻将游戏机器人设计.doc

基于BDI推理模型麻将游戏机器人设计

基于BDI推理模型麻将游戏机器人设计　　摘要：在分析麻将游戏基本规则的基础上，引入BDI推理模型，构建了一种麻将游戏机器人结构，介绍了对机器人信念、愿望、目标等元素的实现，并提出一种游戏中机器人的使用策略，为不同规则的麻将游戏机器人开发提供参考。　　关键词：BDI推理模型；麻将；游戏机器人　　DOIDOI：10.11907/rjdk.171235 　　中图分类号：TP319 　　文献标识码：A 文章编号：1672-7800（2017）007-0090-03 　　0 引言　　麻将游戏深受人们喜爱，网络载体的麻将游戏有着广泛的群众基础，设计能够与玩家互动的麻将游戏机器人具有广阔的应用前景。作为真实玩家的对手，机器人的表现直接影响着游戏的趣味性，由于机器人是计算机操控的角色，开发人员可以为机器人赋予真人玩家没有的能力，例如获取别的玩家手中牌的信息。受商业元素影响，为了缩短产品开发周期，这种作弊手段在现有网络麻将游戏开发中常常用到。该开发方法有一定优势，但与真实世界的脱离会降低玩家对游戏的认同感，进而影响市场占有率，故不可取。BDI模型已经被证实符合正常人的推理思维，因此，设计基于BDI推理模型的麻将游戏机器人是很好的选择。　　1 BDI推理模型　　20世纪80年代，M E Bratman[1]在斯坦福大学的理性Agent项目研究中提出了信念―愿望―意图（Belief-Desire-Intention，BDI）模型。在Bratman工作的基础上，Cohen和Levesque[2]构建了基于正规模态逻辑的BDI模型，而Rao和Georgeff[3]则采用计算树逻辑对BDI模型的组成与推理作了更详细的刻画。BDI模型结构是慎思型Agent的主要结构，信念、愿望、意图是Agent的3种心智状态。信念是Agent对世界的认知，代表着对获得信息的一种评价；愿望是Agent希望达到的一种事件状态，是Agent的一些可选目标集合，并且这些目标可以是相互冲突的；意图是Agent当前想要达到的工作状态，可以是愿望中的一个。BDI推理过程如图1 所示。　　目前，关于BDI推理模型的研究方法主要有两种，一是基于逻辑系统对BDI推理模型的研究和扩展[4]，二是从应用角度利用BDI推理模型进行仿真研究[5]和实用系统开发[6]。仿真研究多借助于现有成熟的仿真平台，如Netlog、Jade、Jack等，实用系统的开发多基于现有的开发平台，如Microsoft Agent。　　BDI模型符合正常人的思维过程，但BDI模型只提供一个抽象的模式化结构，在具体应用中如何将BDI推理模型中抽象的组成实例化是开发工作人员面临的问题，麻将游戏机器人的设计也不例外。　　2 麻将游戏机器人建模　　2.1 麻将游戏基本规则　　各地的麻将游戏融合了当地人的智慧，规则略显不同，但具有通用的麻将游戏基本规则。麻将按花色分为条万筒3种序数牌、东西南北4种风字牌，以及中发白3种箭牌。每种序数牌由1到9组成，共27种，每种牌有4张，整副牌共（3*9+4+3）*4=136张。玩家共有4人，开局后每个玩家分发13张牌。从庄家开始，获得牌权的玩家做动作，获得牌权的方式有顺序获取、碰、吃、杠4种。获得牌权的玩家如果手中牌的数目除以3余1，则先从牌堆中取出一张，然后出牌，直至赢牌或者牌堆剩余数目低于约定数目（一般为1）。　　赢牌牌型必须符合m*AAA+n*ABC+DD的形式，其中m、n可以为0 。玩家游戏的过程可以描述为通过不断替换手中的牌，直至达到赢牌状态。　　麻将游戏是棋牌类游戏的代表，棋牌游戏具有离散事件、动态系统的特点，其状态变化均发生在离散的时间点[7]。麻将游戏的参与者都要遵守游戏规则，机器人也不例外，故机器人的行为是受限的，其做出的每一个行为都要包含于有限的可选动作集中。　　2.2 机器人结构建模　　图2为根据BDI推理模型构建的机器人结构，感知器捕获触发此机器人的消息，并更新记忆库和行为集；状态集存储机器人对当前牌局的认识，是形成目标的依据；记忆库表示机器人对已经发生的事件的记忆，包含自己手中牌、玩家已出牌、不确定牌，其中不确定牌可能在牌堆中，也可能在别的玩家手中；规则库则存储牌局规则，如赢牌的判断方法；行为集中为当前机器人可以执行的行为提示，如吃牌、杠牌、出牌，机器人的行为必须从行为集中选择；更新器负责根据当前状态集、记忆库以及规则更新目标集和状态集。目标为Agent可以达到的某种理想状态，目标集中有多个目标，每个目标的实现难度不同，有的永远不能实现。筛选器对目标集进行筛选，得到一个或一组具有共性的目标；分解器根据策略进行目标分解，得到诸多可一步达到的状态，存入意图集；最后匹配器将行为集中的行为与意图集中的意图相匹配

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于BDI推理模型麻将游戏机器人设计.docVIP