主要内容
1.基本概念:Introduction
2.决策过程:MDP(markovdecisionprocess)
•参考资料:
•UCLCourseonRL,DavidSilver
•ReinforcementLearning:AnIntroductionsecondedition
基本概念
•强化学习主要关注:如何通过一系列行为与环境交互来获得最大累积奖
励
•强化学习是机器学习的一个分支:监督学习、无监督学习、强化学习
•特点
1.没有监督,只有信号
主要内容
1.基本概念:Introduction
2.决策过程:MDP(markovdecisionprocess)
•参考资料:
•UCLCourseonRL,DavidSilver
•ReinforcementLearning:AnIntroductionsecondedition
基本概念
•强化学习主要关注:如何通过一系列行为与环境交互来获得最大累积奖
励
•强化学习是机器学习的一个分支:监督学习、无监督学习、强化学习
•特点
1.没有监督,只有信号
文档评论(0)