游戏人工智能训练方法、装置及服务器和存储介质.pdf

下载文档

2
0
约2.69万字
约 23页
2020-09-15 发布于湖南
举报
版权申诉
保障服务

游戏人工智能训练方法、装置及服务器和存储介质.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 110909890 A (43)申请公布日 2020.03.24 (21)申请号 201911228748.6 (22)申请日 2019.12.04 (71)申请人腾讯科技（深圳）有限公司地址 518000 广东省深圳市南山区高新区科技中一路腾讯大厦35层 (72)发明人蔺洁琼　 (74)专利代理机构深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人王兆林 (51)Int.Cl. G06N 20/00(2019.01) A63F 1/18(2006.01) 权利要求书2页说明书15页附图5页 (54)发明名称游戏人工智能训练方法、装置及服务器和存储介质 (57)摘要本申请公开了一种游戏人工智能训练方法、装置、系统及一种服务器和计算机可读存储介质，该方法包括：分析目标游戏的游戏规则，确定目标游戏的计分项和局内采样项；以计分项为类别划分标准对目标游戏的所有对局进行分层采样得到对局样本；以局内采样项为类别划分标准对所有对局样本中的所有局面进行分层采样得到对局局面样本；基于对局局面样本进行目标游戏的人工智能训练。由此可见，本申请提供的游戏人工智能训练方法，通过两阶段的分层采样增大稀有样本的数量，使得游戏AI能够学习到稀有 A 样本对应的打法，平衡各类别样本的数量，使得 0 游戏AI能够不偏向于学习数量最多的样本，游戏 9 8 9 AI的学习更加灵活，能力更强。 0 9 0 1 1 N C CN 110909890 A 权　利　要　求　书 1/2页 1.一种游戏人工智能训练方法，其特征在于，包括：分析目标游戏的游戏规则，确定所述目标游戏的计分项和局内采样项；以所述计分项为类别划分标准对所述目标游戏的所有对局进行分层采样得到对局样本；以所述局内采样项为类别划分标准对所有所述对局样本中的所有局面进行分层采样得到对局局面样本；基于所述对局局面样本进行所述目标游戏的人工智能训练。 2.根据权利要求1所述游戏人工智能训练方法，其特征在于，所述局内采样项包括动作类型或出牌类型。 3.根据权利要求1所述游戏人工智能训练方法，其特征在于，所述以所述计分项为类别划分标准对所述目标游戏的所有对局进行分层采样得到对局样本，包括：确定每个所述计分项对应的牌局数量为牌局结果中包括每个所述计分项的对局的数量，并确定总牌局数量为所有所述牌局数量的和；根据所述总牌局数量和每个所述计分项对应的牌局数量计算每个所述计分项的采样率作为第一采样率；基于每个所述第一采样率以所述计分项为类别划分标准对所述目标游戏的所有对局进行分层采样得到对局样本。 4.根据权利要求3所述游戏人工智能训练方法，其特征在于，所述根据所述总牌局数量和每个所述计分项对应的牌局数量计算每个所述计分项的采样率作为第一采样率，包括：将所述总牌局数量与每个所述计分项对应的牌局数量的比值作为第一采样率中间值；将第一预设值与每个所述第一采样率中间值的乘积作为每个所述第一采样率。 5.根据权利要求1所述游戏人工智能训练方法，其特征在于，所述以所述局内采样项为类别划分标准对所有所述对局样本中的所有局面进行分层采样得到对局局面样本，包括：在所有所述对局样本中确定每个所述局内采样项对应的局面数量，并确定总局面数量为所有所述局面数量的和；根据所述总局面数量和每个所述局