- 1
- 0
- 约 27页
- 2016-12-11 发布于重庆
- 举报
Predicting Human Interactive Learning by Regret_driven Neural Networks 论文报告——蔡延亮2008-10-14 一、论文中研究的问题 二、方法及创新点 三、实验验证 四、总结展望 一、论文中研究的问题 本文研究的重点是如何用基于后悔驱动的神经网络模型来对人类交互式学习中的行为进行预测。实际上作者的主题是关于博弈论的研究,而不是单单神经网络的一个应用。 博弈论 博弈论 博弈分类 博弈分类 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。 博弈分类 非零和博弈是一种非合作下的博弈,博弈中各方的收益或损失的总和不是零值,它区别于零和博弈。在经济学研究中很有用。 在这种状况时,自己的所得并不与他人的所失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在“双赢”的可能,进而合作。 零和博弈与非零和博弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着
原创力文档

文档评论(0)