- 2
- 0
- 约2.29万字
- 约 97页
- 2026-06-18 发布于山东
- 举报
强化学习
目录
⚫2019年3月23日
⚫引言
⚫强化学习发展史
⚫强化学习简介
⚫2019年4月2日
⚫强化学习算法
⚫实战
⚫2019年4月9日
⚫强化学习应用
⚫未来展望
⚫实战
引言
引言
在连接主义学习中,在学习的方式有三种:非监督
学习(unsupervisedlearning)、监督学习(supervised
leaning)和强化学习。
监督学习也称为有导师的学习,需要外界存在一个
“教师”对给定输入提供应有的输出结果,学习的目的
是减少系统产生的实际输出和预期输出之间的误差,所
产生的误差反馈给系统来指导学习。
非监督学习也称为无导师的学习。它是指系统不存
在外部教师指导的情形下构建其内部表征。学习完全是
原创力文档

文档评论(0)