游戏人工智能训练方法、装置及服务器和存储介质.pdf

游戏人工智能训练方法、装置及服务器和存储介质.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 110909890 A (43)申请公布日 2020.03.24 (21)申请号 201911228748.6 (22)申请日 2019.12.04 (71)申请人 腾讯科技(深圳)有限公司 地址 518000 广东省深圳市南山区高新区 科技中一路腾讯大厦35层 (72)发明人 蔺洁琼  (74)专利代理机构 深圳市深佳知识产权代理事 务所(普通合伙) 44285 代理人 王兆林 (51)Int.Cl. G06N 20/00(2019.01) A63F 1/18(2006.01) 权利要求书2页 说明书15页 附图5页 (54)发明名称 游戏人工智能训练方法、装置及服务器和存 储介质 (57)摘要 本申请公开了一种游戏人工智能训练方法、 装置、系统及一种服务器和计算机可读存储介 质,该方法包括:分析目标游戏的游戏规则,确定 目标游戏的计分项和局内采样项;以计分项为类 别划分标准对目标游戏的所有对局进行分层采 样得到对局样本;以局内采样项为类别划分标准 对所有对局样本中的所有局面进行分层采样得 到对局局面样本;基于对局局面样本进行目标游 戏的人工智能训练。由此可见,本申请提供的游 戏人工智能训练方法,通过两阶段的分层采样增 大稀有样本的数量,使得游戏AI能够学习到稀有 A 样本对应的打法,平衡各类别样本的数量,使得 0 游戏AI能够不偏向于学习数量最多的样本,游戏 9 8 9 AI的学习更加灵活,能力更强。 0 9 0 1 1 N C CN 110909890 A 权 利 要 求 书 1/2页 1.一种游戏人工智能训练方法,其特征在于,包括: 分析目标游戏的游戏规则,确定所述目标游戏的计分项和局内采样项; 以所述计分项为类别划分标准对所述目标游戏的所有对局进行分层采样得到对局样 本; 以所述局内采样项为类别划分标准对所有所述对局样本中的所有局面进行分层采样 得到对局局面样本; 基于所述对局局面样本进行所述目标游戏的人工智能训练。 2.根据权利要求1所述游戏人工智能训练方法,其特征在于,所述局内采样项包括动作 类型或出牌类型。 3.根据权利要求1所述游戏人工智能训练方法,其特征在于,所述以所述计分项为类别 划分标准对所述目标游戏的所有对局进行分层采样得到对局样本,包括: 确定每个所述计分项对应的牌局数量为牌局结果中包括每个所述计分项的对局的数 量,并确定总牌局数量为所有所述牌局数量的和; 根据所述总牌局数量和每个所述计分项对应的牌局数量计算每个所述计分项的采样 率作为第一采样率; 基于每个所述第一采样率以所述计分项为类别划分标准对所述目标游戏的所有对局 进行分层采样得到对局样本。 4.根据权利要求3所述游戏人工智能训练方法,其特征在于,所述根据所述总牌局数量 和每个所述计分项对应的牌局数量计算每个所述计分项的采样率作为第一采样率,包括: 将所述总牌局数量与每个所述计分项对应的牌局数量的比值作为第一采样率中间值; 将第一预设值与每个所述第一采样率中间值的乘积作为每个所述第一采样率。 5.根据权利要求1所述游戏人工智能训练方法,其特征在于,所述以所述局内采样项为 类别划分标准对所有所述对局样本中的所有局面进行分层采样得到对局局面样本,包括: 在所有所述对局样本中确定每个所述局内采样项对应的局面数量,并确定总局面数量 为所有所述局面数量的和; 根据所述总局面数量和每个所述局

文档评论(0)

153****0046 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档