- 9
- 0
- 约2.26万字
- 约 17页
- 2023-05-17 发布于四川
- 举报
本发明提出了一种山区铁路线路优化的深度强化学习方法,属于通信技术领域。本发明从组合优化的角度对提出了一种基于深度强化学习的山区铁路线路优化新框架,称为深度确定性政策梯度,重新设计了目标函数、环境、状态和动作,同时考虑各种对齐约束,深度确定性政策梯度模型生成铁路线形解决方案,无需预先确定交叉口或HPI的垂直点数量,也无需首先找到初始走廊。本发明深度确定性政策梯度模型生成铁路线形解决方案,无需预先确定交叉口或HPI的垂直点数量,也无需首先找到初始走廊,提高了运算效率。
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114819286 A
(43)申请公布日 2022.07.29
(21)申请号 202210338385.7
(22)申请日 2022.04.01
(71)申请人 广州大学
原创力文档

文档评论(0)