- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN114418213B(45)授权公告日2025.07.08
(21)申请号202210056967.6
(22)申请日2022.01.18
(65)同一申请的已公布的文献号申请公布号CN114418213A
(43)申请公布日2022.04.29
(73)专利权人中山大学
地址510275广东省广州市海珠区新港西
路135号
(72)发明人王甲海黄欢欢
(74)专利代理机构广州粤高专利商标代理有限公司44102
专利代理师禹小明
G06Q50/06(2024.01)
GO6N3/042(2023.01)
GO6N3/0455(2023.01)
GO6N3/092(2023.01)
(56)对比文件
CN102117441A,2011.07.06CN106548645A,2017.03.29审查员刘琼琼
权利要求书4页说明书11页附图3页
(51)Int.CI.
GO6Q
GO6Q
10/047(2023.01)10/0631(2023.01)
(54)发明名称
一种基于深度强化学习的城市电动车辆调度方法和系统
(57)摘要
本发明公开了一种基于深度强化学习的城市电动车辆调度方法和系统,方法为一种端到端的方法,给定问题实例作为输入,利用训练好的深度神经网络可以直接输出问题的解。具体地,提出了一个可以捕捉和提取边信息的图神经网络对策略进行建模,以有效地解决非对称车辆路径问题,且提出了一个软约束+硬约束的两阶段训练方法,以有效地处理带时间窗电动车辆路径问题中的复杂约束。与传统方法相比,它能在获得更好求解效果的前提下大幅度地缩减求解时
CN
CN114418213B
将带时间窗电动车辆路径问题建模成一个有向完全图,仓库、充
电站和客户为图中的结点,任意两个结点之间通过边相连接,对
需求、距离和时间数据分别进行归一化处理
使用编码器分别对所述有向完全图中的点信息和边信息进行编码得到对应的特征表示
使用解码器进行解码,在每步解码中根据步骤S2中得到的点和边
的特征表示以及当前车辆状态信息和历史路径信息,以自回归的
方式逐步构造路径,得到问题的解
根据所述问题的解计算出总回报,使用REINFORCE算法对编码器和解码器的参数进行更新
将训练好的编码器和解码器用于求解带时间窗电动车辆路径问题
S2
S3
S5
CN114418213B权利要求书1/4页
2
1.一种基于深度强化学习的城市电动车辆调度方法,其特征在于,包括以下步骤:
S1:将带时间窗电动车辆路径问题建模成一个有向完全图,仓库、充电站和客户为图中的结点,任意两个结点之间通过边相连接,对需求、距离和时间数据分别进行归一化处理;
S2:使用编码器分别对所述有向完全图中的点信息和边信息进行编码得到对应的特征表示;
S3:使用解码器进行解码,在每步解码中根据步骤S2中得到的点和边的特征表示以及当前车辆状态信息和历史路径信息,以自回归的方式逐步构造路径,得到问题的解;
S4:根据所述问题的解计算出总回报,使用REINFORCE算法对编码器和解码器的参数进行更新;
S5:将训练好的编码器和解码器用于求解带时间窗电动车辆路径问题;
所述步骤S1中结点信息为v?=(d?,ei,1;,t;),其中,d表示客户需求,e表示最早服务时间,1;表示最晚服务时间,t;表示结点类型,且有:
其中,Va,Vs,V分别表示仓库结点集合、充电站结点集合和客户结点集合;
所述步骤S1中边信息为e:=(dis,,time;,a),其中,dis,表示距离,time,表示时
间,a;表示最近邻,且有:
所述步骤S2具体包括以下步骤:
S2.1:使用两个嵌入层分别将所述结点信息v;和边信息e?;映射成高维的特征向量,得到图神经网络的第一层输入h9和hei:
h?=Wyvi+bv
he;=W?eij+bg
式中,W,bv,WE,bg均为可训练的参数;
S2.2:使用图神经网络,将h和hei;经过N层图神经网络得到最终的特征向量表示,在图神经网络的每一层中,每一点和边都会聚集相邻点和边的信息以
您可能关注的文档
- CN114174895B 用于增强现实的系统和方法 (奇跃公司).docx
- CN114176530B 一种适用不同年龄患者的麻醉状态评估系统及方法 (深圳市威浩康医疗器械有限公司).docx
- CN114187153B 基于gis的乡村网格化消防管理方法、系统及存储介质 (深圳市荣信诚科技有限公司).docx
- CN114187201B 模型训练方法、图像处理方法、装置、设备及存储介质 (百果园技术(新加坡)有限公司).docx
- CN114188013B 一种阿尔兹海默症的认知及脑影像数据整合评估方法 (北京智精灵科技有限公司).docx
- CN114200490B 电离层闪烁的多径噪声干扰量化评估方法及装置 (中电科星河北斗技术(西安)有限公司).docx
- CN114202548B 一种叉车托盘的定位方法、装置、存储介质及电子设备 (紫东信息科技(苏州)有限公司).docx
- CN114205517B 图像模糊校正设备及其控制方法、摄像设备和存储介质 (佳能株式会社).docx
- CN114219723B 一种图像增强方法、图像增强装置和计算机可读存储介质 (浙江大华技术股份有限公司).docx
- CN114222271B 用于车辆通信的副链路监测方法、装置、介质及电子设备 (腾讯科技(深圳)有限公司).docx
- CN114428613B 一种流程编排方法、系统、介质及计算机程序产品 (阿里巴巴(中国)有限公司).docx
- CN114439686B 一种风力发电机组偏航优化控制系统及其控制方法 (许昌许继风电科技有限公司).docx
- CN114445309B 深度学习用缺陷图像生成方法以及用于深度学习用缺陷图像生成方法的系统 (斗山重工业建设有限公司).docx
- CN114466476B 一种led照明灯的光色调节方法及其光源和调节装置 (林璧光).docx
- CN114502090B 消融监测系统和方法 (维兰医疗技术公司).docx
- CN114510081B 通信延迟约束下的多无人机集群导航方法 (西安电子科技大学).docx
- CN114556110B 液体转移装置与方法、生化物质反应装置及生化物质分析装置与方法 (深圳华大智造科技股份有限公司).docx
- CN114581278B 基于智能路灯的大气污染物溯源排查方法、终端及系统 (同济大学).docx
- CN114581359B 一种证件图像缺陷检测方法及装置 (航天信息股份有限公司).docx
- CN114581701B 一种t2加权影像特征生成动态增强影像特征的方法 (杭州电子科技大学).docx
最近下载
- 切削液考试题库及答案.doc VIP
- 《大数据采集》期末考试复习题库(含答案).docx VIP
- 哈尔滨市早市现状调研及分析.pdf VIP
- 2023-2024学年广东省湛江二中学港城中学数学七年级第一学期期末检测试题含解析.doc VIP
- 供配电系统第一章供配电系统第一章.doc VIP
- 广东省深圳市罗湖区2024-2025学年八年级上学期期末考试物理试题(含答案).pdf VIP
- 儿童绘本故事脚本创作及模板指导.docx VIP
- 上锚板水平测量记录表.doc VIP
- 黄山杯奖评选办法.pdf VIP
- 2021.03.29+方法精讲-申论7+李梦圆+(笔记)(2022国考笔试系统班-1期).pdf VIP
原创力文档


文档评论(0)