- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优化的搜索算法
电脑棋手的思维 王金一 你可曾听说过“深蓝”? 1997年5月11日,IBM开发的“深蓝”击败了国际象棋冠军卡斯帕罗夫。 电脑棋手:永不停歇的挑战! 1988年“深思”击败了丹麦特级大师拉森。 1993年“深思”第二代击败了丹麦世界优秀女棋手小波尔加。 电脑棋手:永不停歇的挑战! 2001年“更弗里茨” 击败了除了克拉姆尼克之外的所有排名世界前十位的棋手。 2002年10月“更弗里茨”与世界棋王克拉姆尼克在巴林交手,双方以4比4战平。 2003年1至2月“更年少者”与卡斯帕罗夫在纽约较量,3比3战平。 领域在延伸 许多人在努力 他们来自于何方? Canada、America、England、China、Japan、Holland、Mexico…… 解谜:电脑是怎样下棋的 ——人机博弈程序的一般设计方法 (1)第一步该做什么? 几种棋盘表示的方式 二维数组——直观 (2)接下来怎么办? 产生合法走步的规则,使博弈能公正的进行,并且能够判断对手是否乱走。依赖于具体棋类特征。 是一段将局面所有可能的正确走法罗列出来的程序。称之为走法产生。 几种走法产生的实现方式 一般做法 位运算走法产生之例 位运算走法产生之要求 一个基于比特棋盘的完善的数据库 该数据库应位于内存中 (3)终于到核心了 搜索的基本方法 极大极小值 负极大值 Alpha-Beta搜索 极大极小值搜索 对抗性搜索 静态估值 有限深度 深度优先 负极大值算法 重点在于:父节点的值是各子节点的值的负数的极大值。 Alpha-Beta剪枝 Alpha-Beta搜索 优化的搜索算法 渴望搜索 极小窗口搜索 置换表 哈希表 Zobrist哈希技术 优化的搜索算法 迭代深化 历史启发 杀手启发 SSS*/DUAL*算法 MTD(f)算法 (4)最后 评估局面优劣,配合搜索技术做出智能的选择——估值技术 估值的几种形式 终点估值 思路清晰,容易设计,模块独立性高, 同搜索算法耦合程度低 速度慢 估值函数的内容及其调试 Score=aX+bY+cZ+dK+…… X=车+马+炮+…… 参数确定的方法 手工调整 爬山法 蒙特卡罗 模拟退火 遗传算法 爬山法的缺陷——初值依赖 蒙特卡罗 使用多种初始参数,从不同的地方开始多次爬山 有足够多次的爬山,出现频率最高的结果是最优解的概率就会足够大 不同初值的大量采样,使运算效率低 模拟退火 MetroPolis重要性采样的基本思想:在寻优的开始使用较高的概率进行随机突跳,随着寻优过程的深入逐步降低这一接受不佳参数概率。并且随着搜索的深入,可接受的参数的不佳程度也越来越小。 模拟退火 一次对参数改变一点,测试。 提高,保留 不提高,在一定概率上继续 由粗到细,逼近最优参数 遗传算法 随机产生一组初始个体构成初始种群,并评价每一个体的适配值。 判断算法收敛准则是否满足,若满足则输出搜索结果,否则执行以下步骤。 根据适配值大小以一定方式执行复制操作。 按交叉概率pc之行交叉操作。 按变异概率pm执行变异操作。 返回上面第二步骤。 遗传算法 适配值:对个体进行评价的指标,算法优化的主要信息,与个体的目标值对应 复制:复制概率正比于适配值 交叉:交换父代个体中的部分信息产生后代,继承 变异:随机改变个体中的某些信息产生新个体,增加种群多样性 Genetic Algorithms 优越性 全空间并行搜索,重点集中在高性能部分,防止陷入局部最优 孰优孰劣? 名局测试 和其他博弈程序对弈 选不同的参数,自相对弈 同向下几层的搜索结果比较 标准遗传算法优化框图 使用遗传算法优化参数估值的过程 * * 1980年他获得世界少年组冠军 1982年他并列夺得苏联冠军 1985年22岁的卡斯帕罗夫成为历史上最年轻的国 际象棋冠军 现在的积分是2849,这一分数是有史以来最高分。 远远领先于第二位的克拉姆尼克的2770 卡氏何许人也? Checkers Sokoban Chinese chess Go Othello Poker Lines of action Hex Awari Amatons Shogi Rosambo Domineering …… …… ?????????????????? University of Alberta、University of Wisconsin、University of Maryland、 MIT、University of Tokyo、University of Albama、University of C
您可能关注的文档
最近下载
- DB37T 5093-2017非固化橡胶沥青防水涂料工程应用技术规程.docx
- 企业内部控制培训精完整版PPT课件-2024鲜版.ppt VIP
- 人乳头瘤病毒感染护理.pptx VIP
- 压疮品管圈成果汇报PPT幻灯片.ppt VIP
- 车险承保方案.pdf VIP
- 中华民族共同体概论教案合集(第一讲-第十六讲)附《中华民族共同体概论》课程大纲.doc VIP
- “中华民族共同体概论”课程教学与建设关键问题探讨.docx VIP
- 诸侯纷争与变法运动【课件】.pptx VIP
- 中国高血压防治指南(2024年修订版)_中国高血压防治指南修订委员会__.pdf VIP
- “扬子石化杯”2024年第38届中国化学奥林匹克(江苏赛区)初赛化学.pdf VIP
文档评论(0)