- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要
棋類博弈是人工智慧的重要研究主題之一。而在圍棋方面,由於圍棋的搜索空間太大、電腦難於處理模糊概念且難於設計學習演算法,目前最優秀的圍棋程式的水準還處於業餘低段水準。電腦圍棋被認為是在繼國際象棋之後人工智慧領域中最困難的新挑戰之一。圍棋是檢驗人工智慧發展水準的良好環境,如何提高圍棋程式的棋力是人工智慧領域的一大難題。所以電腦圍棋研究具有重要的理論意義和實用價值。
本論文將介紹如何基於UCT演算法設計和實現圍棋引擎。第一部分介紹了電腦圍棋研究背景及意義、研究狀況和關鍵技術,包括Monte Carlo方法和UCT演算法的理論。第二部分在圍棋引擎總體概述的基礎上說明其總體功能模組,並對各個子功能模組進行描述,重點講解了交替下子的流程以及棋步產生模組。第三部分闡明了基於UCT演算法的圍棋引擎的設計,先設計圍棋引擎的總體流程,再依次說明UCT演算法流程、棋步合法性的判斷等模組的具體設計流程。第四部分探討了基於UCT演算法的圍棋引擎的實現,在分析圍棋引擎核心模組UCT演算法實現的基礎上,詳細說明了候選步的產生及管理機制,節點的UCT選擇,展開節點和棋局模擬,分析指出不同的因素和策略對電腦圍棋引擎的影響,其中棋局類比的著手庫模式匹配和其它圍棋知識對加強程式棋力有至關重要的作用。最後對主要工作做了總結,提出進一步的發展目標。
基於上述內容,實現了一個基於UCT演算法的圍棋引擎Tao Go,支援GMP、GTP圍棋協定,SGF檔調試輸出和統計UCT類比棋局的資料,目前能正常與圍棋用戶端進行通信,實現人機和機機對弈。
關鍵字:人工智慧 電腦圍棋 UCT演算法 模式匹配
目 錄
1 緒論 1
1.1 研究背景及意義 1
1.2 研究狀況 1
1.3 關鍵技術 2
1.3.1 Monte Carlo方法 2
1.3.2 UCT演算法 3
2 基於UCT的圍棋引擎的概述 5
2.1 圍棋引擎的總體概述 5
2.2 圍棋引擎的總體功能模組 5
2.3 交替下子流程模組 7
2.4 棋步產生(UCT)模組 8
2.5 棋步合法性判斷模組 10
2.6 算氣模組 10
2.7 更新棋盤(提子)模組 11
2.8 勝負計算模組 11
3 基於UCT的圍棋引擎的設計 12
3.1 圍棋引擎總體流程設計 12
3.2 UCT演算法具體流程設計 13
3.3 棋步合法性判斷模組設計 16
3.4 算氣模組設計 18
3.5 更新棋盤(提子)模組設計 19
3.6 勝負計算模組設計 20
4 基於UCT的圍棋引擎的實現 22
4.1 軟硬體開發環境 22
4.2 圍棋引擎的資料結構 22
4.2.1 棋局數據 22
4.2.2 UCT Tree數據 23
4.3 圍棋引擎的UCT演算法實現 23
4.3.1 UCT演算法的核心實現 23
4.3.2 候選步的產生方式及管理機制 26
4.3.3 選擇節點(UCT選擇) 28
4.3.4 展開節點 31
4.3.5 棋局模擬 33
4.4 圍棋引擎運行效果 41
4.4.1 圍棋協議對弈測試 41
4.4.2 調試模式的SGF檔 43
4.4.3 UCT類比棋局資料統計 44
5 工作總結及未來展望 45
5.1 工作總結 45
5.2 未來展望 45
致 謝 46
參 考 文 獻 47
英 文 摘 要 49
1 緒論
1.1 研究背景及意義
博弈是人工智慧的重要研究主題,人工智慧的發展在很大程度上得益於博弈研究的發展。1997年著名的深藍電腦戰勝國際象棋世界冠軍卡斯帕羅夫成為轟動一時的新聞事件[l]。可以說,作為博弈研究的主要內容之一,棋類博弈得到了滿意的解決,唯一的例外的是圍棋,目前最優秀的圍棋程式還處於業餘低段水準。
圍棋是博弈的一種,屬雙人零和博弈[2]。它起源於3000多年前的中國,充分體現了東方人的智慧,盛行于中日韓,逐漸在歐美流行。它比國際象棋複雜得多,正因為如此,很多人工智慧學家、心理學家和數學家也投入到了電腦圍棋研究領域。電腦圍棋這個名稱來自於Computer Go的直譯,略顯生硬。簡單地說,電腦圍棋就是結合人工智慧技術教電腦下圍棋,以達到與人類棋手相抗衡的目的。
由於圍棋的搜索空間太大、電腦難於處理模糊概念且難於設計學習演算法,造成了電腦圍棋程式的棋力難於提高。圍棋是檢驗人工智慧發展水準的良好環境,如何提高圍棋程式的棋力是人工智慧領域的一大難題。同時,開發出與人類棋手水準相當的圍棋程式也有助於對人類認知能力的理解。所以電腦圍棋研究具有重要的理論意義和實用價值。
1.2 研究狀況
電腦圍棋自Zobrist在1970年設計出第一個可與人對弈的程式以來[3],至今已有約四十年的歷史。由於圍棋本身的特質,使得電腦圍棋在繼西洋棋、象棋之後,成為人工智慧中一個相當引人注目的新挑
您可能关注的文档
最近下载
- 钢柱、钢梁、钢结构制作安装.pdf VIP
- xx售楼中心、样板间、会所物业服务方案.doc VIP
- 2025年贵州贵阳乌当富民村镇银行招聘客户经理笔试历年典型考题及考点剖析附带答案详解.docx
- 2025年初级钳工试题及答案钳工试题(含答案).docx VIP
- 一张奖状的动力(1).doc
- 框架钢结构施工组织设计.pdf VIP
- 2025年交管学法减分考试题库以及答案(160题完整版) .pdf VIP
- 学校食堂食材配送服务方案(肉类、粮油米面、蔬菜水果类).docx VIP
- 2025年交管学法减分考试题库以及答案(160题完整版) .pdf VIP
- 会计师事务所质量管理制度.docx VIP
文档评论(0)