2026《变体飞行器外形自主决策分析》6000字.docxVIP

  • 1
  • 0
  • 约1.17万字
  • 约 16页
  • 2026-04-25 发布于湖北
  • 举报

2026《变体飞行器外形自主决策分析》6000字.docx

PAGE77

PAGE1

PAGE1

变体飞行器外形自主决策分析

目录

TOC\o1-3\h\u23758变体飞行器外形自主决策分析 1

47161.1算法理论基础 1

269791.1.1强化学习原理 1

303911.1.2LSTM原理 3

273961.2基于DDPG算法的外形决策框架 4

1151.3带有任务分类器的DDPG算法设计 6

213911.3.1任务分类器设计 6

83711.3.2奖励函数设计 8

91691.3.3DDPGwTC算法流程 8

248371.4网络训练 11

8201.4.1任务分类器网络训练 11

181681.4.2DDPGwTC算法训练 11

55431.5仿真实验 14

1.1算法理论基础

1.1.1强化学习原理

强化学习是机器学习的一个重要分支,2016年的AlphaGo主要使用的就是强化学习技术REF_Re\r\h[54]。和人类的学习方法类似,强化学习的核心理念就是不断试错,让智能体在与环境的互动中学习到最优的行动方式。在强化学习中,进行学习的本体称之为智能体,智能体以外的一切则为环境,被定义为智能体在某一时刻的

文档评论(0)

1亿VIP精品文档

相关文档