PredictingHumanInteractiveLearningbyRegretdrivenN.pptVIP

下载本文档

1
0
约 27页
2016-12-11 发布于重庆
举报

PredictingHumanInteractiveLearningbyRegretdrivenN.ppt

Predicting Human Interactive Learning by Regret_driven Neural Networks 论文报告——蔡延亮2008-10-14 一、论文中研究的问题二、方法及创新点三、实验验证四、总结展望一、论文中研究的问题本文研究的重点是如何用基于后悔驱动的神经网络模型来对人类交互式学习中的行为进行预测。实际上作者的主题是关于博弈论的研究，而不是单单神经网络的一个应用。博弈论博弈论博弈分类博弈分类按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息，在这种情况下进行的博弈就是不完全信息博弈。博弈分类非零和博弈是一种非合作下的博弈，博弈中各方的收益或损失的总和不是零值，它区别于零和博弈。在经济学研究中很有用。在这种状况时，自己的所得并不与他人的所失的大小相等，连自己的幸福也未必建立在他人的痛苦之上，即使伤害他人也可能“损人不利己”，所以博弈双方存在“双赢”的可能，进而合作。零和博弈与非零和博弈相对，是博弈论的一个概念，属非合作博弈，指参与博弈的各方，在严格竞争下，一方的收益必然意味着

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

PredictingHumanInteractiveLearningbyRegretdrivenN.pptVIP