CN115509190B 基于深度强化学习的舰船导弹目标分配方法、装置和设备（湖南遁一科技有限公司）.docxVIP

下载本文档

0
0
约2.75万字
约 45页
2026-01-19 发布于重庆
举报

CN115509190B 基于深度强化学习的舰船导弹目标分配方法、装置和设备（湖南遁一科技有限公司）.docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN115509190B(45)授权公告日2025.07.08

(21)申请号202211181219.7

(22)申请日2022.09.27

(65)同一申请的已公布的文献号申请公布号CN115509190A

(43)申请公布日2022.12.23

(73)专利权人湖南遁一科技有限公司

地址410000湖南省长沙市高新开发区尖

山路39号长沙中电软件园一期9栋4楼401-155室

(72)发明人刘芝桥

(74)专利代理机构长沙国科天河知识产权代理有限公司43225

专利代理师赵小龙

(56)对比文件

Xiao,Y.-G.Jin,S.-C.Mao,X.Wu,G.-H.Lu,

Z.-F..Missile-targetassignmentmethodofnavalshipbasedondeepreinforcement

learning.ControlTheory

Applications.2024,第41卷(第06期),全文.

肖友刚；金升成；毛晓；伍国华；陆志沣；.基于深度强化学习的舰船导弹目标分配方法.控制理论与应用.2024,第41卷(第06期),990-998.

金升成.海上运输护航舰船防空导弹任务规划强化学习方法研究.硕士电子期刊.2025,(第02期),全文.

审查员高明强

(51)Int.CI.

GO5B19/418(2006.01)权利要求书4页说明书14页附图5页

(54)发明名称

基于深度强化学习的舰船导弹目标分配方法、装置和设备

(57)摘要

CN115509190B本申请涉及武器目标分配技术领域的一种基于深度强化学习的舰船导弹目标分配方法、装置和设备。该方法包括：构建舰船多类型导弹目标分配数学模型，基于该数学模型建立由四元组构成的马尔可夫决策过程；构建基于Transformer模型的融合注意力机制的深度强化学习模型；该模型用于根据当前舰船态势感知中所知的战场信息实现舰船导弹目标分配决策；采用带基线的策略梯度法训练深度强化学习模型；根据马尔可夫决策过程中当前时间步下的四元组信息，采用训练后的融合注意力机制的深度强化学习模型对舰船导弹目标进行分配。本方法能

CN115509190B

建立舰船导弹目标分配数学模型

200

根据舰船导弹目标分配数学模型建立由四元组构成的马尔可夫决策过程

构建基于Transformer模型的融合注意力机制的深度强

化学习模型；融合注意力机制的深度强化学习模型用

于根据当前舰船态势感知中所知的战场信息实现舰船

导弹目标分配决策

采用带基线的策略梯度法训练融合注意力机制的深度强化学习模型

206

根据马尔可夫决策过程中当前时间步下的四元组信息，采用训练后的融合注意力机制的深度强化学习模型对舰

船导弹目标进行分配208

202

204

CN115509190B权利要求书1/4页

1.一种基于深度强化学习的舰船导弹目标分配方法，其特征在于，所述方法包括：

建立舰船导弹目标分配数学模型；

根据舰船导弹目标分配数学模型建立由四元组构成的马尔可夫决策过程；

构建基于Transformer模型的融合注意力机制的深度强化学习模型；所述融合注意力机制的深度强化学习模型用于根据当前舰船态势感知中所知的战场信息实现舰船导弹目标分配决策；

采用带基线的策略梯度法训练所述融合注意力机制的深度强化学习模型；

根据马尔可夫决策过程中当前时间步下的四元组信息，采用训练后的融合注意力机制的深度强化学习模型对舰船导弹目标进行分配。

2.根据权利要求1所述的方法，其特征在于，建立舰船导弹目标分配数学模型，包括：

获取当前舰船携带的防空导弹类型数量k、各类型防空导弹针对来袭目标的拦截距离集合D={D?,D?,...,D}、各类型防空导弹成功命中来袭目标的概率集合DP={dp?,dp?,...,

dp}、各类型防空导弹的飞行速度集合VS={vs?,VS?,...,vsk};其中，k为大于1的整数，集

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

CN115509190B 基于深度强化学习的舰船导弹目标分配方法、装置和设备（湖南遁一科技有限公司）.docxVIP