智能体南京邮电大学计算机学院软件学院.PPT

智能体南京邮电大学计算机学院软件学院.PPT

智能体南京邮电大学计算机学院软件学院

* 状态和模型距离的度量 * 结合模型相似性的选择性迁移 * 基于模型迁移的博弈约简 * 实验和分析 Yujing Hu, Yang Gao, Bo An. Learning in Multi-agent Systems with Sparse Interactions by Knowledge Transfer and Game Abstraction. AAMAS 2015: 753-761. Luowei Zhou, Pei Yang, Chunlin Chen, Yang Gao. Multiagent Reinforcement Learning with Sparse Interaction by Negotiation and Knowledge Transfer. IEEE Transaction on Cybernetics 47(5):1238-1250, 2017. * 总 结 报告要点 大数据决策导致大规模博弈推理 多智能体强化学习是一种复杂的计算范型 非共享支付矩阵情况下的博弈均衡协商机制 相似博弈的博弈均衡迁移 稀疏交互下的知识迁移和博弈约简 2018.08.24 谢谢各位专家! 请提宝贵意见! 参考文献 Biggio Battista, Fumera Giorgio, Roli Fabio. Design of robust classifier

文档评论(0)

1亿VIP精品文档

相关文档