人工智能与信息社会课件:305双方完全信息零和博弈的博弈树.pdf 10页

  • 0
  • 0
  • 0
  • 约1.44千字
  • 2020-08-13 发布

人工智能与信息社会课件:305双方完全信息零和博弈的博弈树.pdf

文档工具:
    1. 1、本文档共10页,可阅读全部内容。
    2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
    3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
    4. 文档侵权举报电话:19940600175。
    人工智能与信息社会 基于决策树和搜索的智能系统:博弈树 陈斌北京大学gischen@pku.edu.cn 完全信息 〉 游戏的状态信息对所有玩家都是完全可见的。 井字棋、黑白棋、象棋、围棋 北京大学地球与空间科学学院/ 陈斌/2018 不完全信息 〉 每个玩家有自己的私有信息,游戏的策略需 要建立在对真实状态的猜测之上 军棋、牌类游戏 北京大学地球与空间科学学院/ 陈斌/2018 零和博弈 〉 零和博弈中双方 (或多方)的收益相加为0 〉 只要让其他人的收益最小化,即可使自己的 收益最大化 北京大学地球与空间科学学院/ 陈斌/2018 非零和博弈 〉 非零和博弈中,所有人的收益之和不为0 , 存在 “合作”或者 “双赢”的可能。 〉 自己的所得并不与他人的所失的大小相等, 使他人收益最小化也可能 “损人不利己” 囚徒困境,麻将 北京大学地球与空间科学学院/ 陈斌/2018 非零和博弈 〉 囚徒困境 乙沉默(合作) 乙认罪(背叛) 甲服刑10年;乙 甲沉默(合作) 二人同服刑半年 即时获释 甲即时获释;乙 甲认罪(背叛) 二人同服刑5年 服刑10年 北京大学地球与空间科学学院/ 陈斌/2018 非零和博弈 〉 只考虑一个人最佳选择并非考虑团体的最佳 选择。 〉 选择使对方收益最小化的策略并不能使自己 获得最大收益 〉 在麻将中常有为了不让一个对手胡大牌,故 意让另一个对手胡小牌的策略 北京大学地球与空间科学学院/ 陈斌/2018 博弈树构建 〉 博弈树的每一个节点对应于每一个局面,每 一条边对应于一个动作 局面 1 动作1 动作2 动作3 局面 局面 局面 2 3 4 北京大学地球与空间科学学院/ 陈斌/2018 博弈树构建 〉 在完全信息零和博弈的条件下,能够构建简 单的博弈树 〉 如果在不完全信息、非零和博弈的情况下, 博弈树较为复杂 北京大学地球与空间科学学院/ 陈斌/2018 博弈树构建 〉 井字棋的博弈树 最高有9层 北京大学地球与空间科学学院/ 陈斌/2018

    文档评论(0)

    • 内容提供方:woxiangang
    • 审核时间:2020-08-13
    • 审核编号:8073115011002133

    相似文档