- 12
- 0
- 约2.05千字
- 约 19页
- 2019-11-03 发布于天津
- 举报
神经网络学习控制 Neural Network based Learning Control 7.1 Reinforcement Learning(再励学习,自强式学习) 神经网络学习方法有三类: 监督学习 Supervised Learning —例如BP —有明确的“教师”信号 无监督学习 Unsupervised Learning —没有任何“教师”信号 —只是通过输入数据的内部信息 相当自组织?类方法。 —例如 再励学习Reinforcement Learning 源于心理学简单的说,一个人有笔钱,有几个投资选择A.B.C.他投B,赚钱了,再投B 。until B不赚钱了,或有突发事件使他觉得A更好,于是将钱投到A。 由Barto 等人提出的Reinforcement Learning 可称为ASE/ACE模型,即由 ASE:Associative Search Element :关联搜索单元 ACE:Adaptive Critic Element:自适应评判单元构成。 ASE的作用是确定控制信号y ACE则对再励信号r进行改善,得到AS
您可能关注的文档
- 礼品哥工具组合途马工具学习资料.ppt
- 礼品哥小家电艾美特教程文件.ppt
- 理财规划流程教学讲义.ppt
- 理论力学哈工大第七版第一章课件教学讲义.ppt
- 立法学2012课件教材课程.ppt
- 立体构成课件第一讲教学讲义.ppt
- 立体几何中的翻折问题教学文案.ppt
- 立体几何中的向量方法2说课材料.ppt
- 留连戏蝶时时舞培训资料.ppt
- 秘书助理训练压力管理教学内容.ppt
- 依依股份(001206)宠物卫生护理龙头稳健增长,加速推进产业链整合-260131-国盛证券-26页.pdf
- 奕东电子(301123)精密零部件稀缺厂商,液冷领域多年布局-260129-银河证券-25页.pdf
- 主题形态学输出0130:白酒主题底部反转-260202-华福证券-14页.pdf
- 天士力(600535)创新驱动稳增长,华润赋能焕新生-260202-申万宏源-24页.pdf
- 金融工程定期:开源交易行为因子绩效月报(2026年1月)-260130-开源证券-12页.pdf
- 金融工程定期:资产配置月报(2026年2月)-260131-开源证券-12页.pdf
- 赣06ZJ902 ZPS住宅厨房卫生间废气垂直排放系统.docx
- 西南05G701(一)框架轻质填充墙构造图集.docx
- 苏G9203-2 预应力混凝土V形折板(冷拔低碳钢丝折板构件).docx
- 12YD4 电力与照明配电装置.docx
原创力文档

文档评论(0)