强化学习基础与量化交易应用.pdf

主要内容

1.基本概念:Introduction

2.决策过程:MDP(markovdecisionprocess)

•参考资料:

•UCLCourseonRL,DavidSilver

•ReinforcementLearning:AnIntroductionsecondedition

基本概念

•强化学习主要关注:如何通过一系列行为与环境交互来获得最大累积奖

•强化学习是机器学习的一个分支:监督学习、无监督学习、强化学习

•特点

1.没有监督,只有信号

文档评论(0)

1亿VIP精品文档

相关文档