- 4
- 0
- 约1.94万字
- 约 14页
- 2023-06-20 发布于四川
- 举报
本发明公开了一种基于机器学习的棋类自学习方法,该方法的落子选择输出层和价值评估输出层共用同一个神经网络输入层和隐藏层,采用蒙特卡洛搜索树构建策略优化器。该方法训练过程分为数据生成和神经网络训练两部分训练的过程则是使神经网络输出价值标量与自我对局的最终结果之间的误差尽可能的小,使神经网络输出的落子向量与蒙特卡洛树对每一步搜索给出的决策向量尽可能的接近。本发明通过引入神经网络作为落子选择器和价值评估器,蒙特卡洛树作为策略优化器,完全不需要人类的棋类知识,即可完成自我对弈,最终完成对神经网络的训练。该
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113318451 A
(43)申请公布日 2021.08.31
(21)申请号 202110591851.8
(22)申请日 2021.05.28
(71)申请人 南京邮电大学
地址
您可能关注的文档
- 一种重力式U型桥台模板支撑体系及其安装方法.pdf
- 一种肼可视化荧光探针分子及其制备方法.pdf
- 基于YOLOv3检测定位裁剪及fine-tune的输电线路巡检图像处理方法.pdf
- 一种苦荞皮粉提取黄酮设备.pdf
- 视频识别模型训练方法、装置、设备以及存储介质.pdf
- 一种园林绿地空气颗粒物检测及预警装置.pdf
- 一种CAN总线标识符、通信方法以及通信系统.pdf
- 不锈钢成型装置及其使用方法.pdf
- 预折弯检测设备.pdf
- 一种手镯取出器.pdf
- 山西天一大联考2025-2026学年高二上学期期末学情监测语文试题(试卷+解析).docx
- 山西忻州部分学校2025-2026学年高一上学期2月质量检测数学试题(人教B版)(试卷+解析).docx
- 山西运城市2025-2026学年高二第一学期期末调研测试数学试题(试卷+解析).docx
- 陕西省榆林市榆阳区2025-2026学年八年级上学期期末地理试题(试卷+解析).docx
- 陕西西安市碑林区2025-2026学年度第一学期期末八年级生物试题(试卷+解析).docx
- 四川省广元市苍溪县2025-2026年八年级上学期期末道德与法治试题(试卷+解析).docx
- 江苏泰州市姜堰区2025-2026学年七年级上学期1月期末数学试题(试卷+解析).docx
- 江苏省扬州市邗江区2025-2026学年九年级上学期期末考试化学试题(试卷+解析).docx
- 江西上饶市铅山县2025-2026学年第一学期期末考试八年级数学试题(试卷+解析).docx
- 江苏扬州市高邮市2025-2026学年度第一学期期末学业质量监测试题九年级英语(试卷+解析).docx
原创力文档

文档评论(0)