- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Stackelberg策略的多Agent强化学习警力巡逻路径-北京理工大学
第 卷 第 期 北 京 理 工 大 学 学 报
37 1 Vol.37 No.1
年 月
2017 1 TransactionsofBeiin InstituteofTechnolo Jan.2017
jg gy
基于Stackelber策略的多Aent强化
g g
学习警力巡逻路径规划
,
解易 顾益军
( , )
中国人民公安大学 网络安全保卫学院 北京 100038
: ,
摘 要 为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题 提出一种新的基于多
,
的强化学习算法 在给定攻击目标分布的情况下 规划任意多防御者和攻击者条件下的最优巡逻路径 考虑
aent . .
g
,
到防御者与攻击者选择策略的非同时性 采用了 强均衡策略作为每个 选择策略的依据 为了验
Stackelber aent .
g g
,
证算法 在多个巡逻任务中进行了测试 定量和定性的实验结果证明了算法的收敛性和有效性
. .
: ; ; ;
关键词 巡逻路线规划 Stackelber强均衡策略 多 aent 强化学习
g g
中图分类号: 文献标志码: 文章编号: ( )
TP399 A 1001-0645201701-0093-07
: /
DOI10.15918 .tbit1001-0645.2017.01.019
j
PolicePatrolPathPlannin Usin StackelberEuilibrium
g g g q
BasedMultiaentReinforcementLearnin
g g
,
XIEYi GUYiun
j
您可能关注的文档
- 吕变庭对北青报记者说是由一位朋友告知-成都铁路学校.DOC
- 吕仁和教授诊治糖尿病糖尿病肾脏病及肾病综合征的-世界中医药.PDF
- 含DM相互作用的海森堡模型的完全可积性-四川师范大学学报自然.PDF
- 含苯废气冷凝回收系统中板式蒸发器的开发-evwpscom.PDF
- 含高渗透率分布式光伏的配电网故障停电损失评价-电力需求侧管理.PDF
- 员工薪酬体系的构成.PPT
- 周期节律与肿瘤关系的分子机理-中国生物化学与分子生物学报.PDF
- 味清热类中药对绿脓杆菌抑菌作用的聚类分析-中国试验方剂学杂志.PDF
- 品种介绍-陕西种业网.DOC
- 哈尔滨亿汇达电气科技发展股份有限公司2016年年报告摘要.PDF
- 基于SIFTGSVM的嵌入式印鉴识别系统设计.PDF
- 基于不确定性分析框架的动态环状河网水质模型-水科学进展.PDF
- 基于UPZO数据的湖北油菜种植分布信息提取-国土资源遥感.PDF
- 基于介质访问控制的智能建筑工业以太网协议设计.PDF
- 基于传播因子的分布式信源中心波达方向估计-Journalof.PDF
- 基于任务和角色的学习流访问控制模型-重庆理工大学学报.PDF
- 基于元胞遗传算法的智能组卷的研究-计算机工程与应用.PDF
- 基于先验信息水平集方法的肝脏CT序列图像自动分割-中南大学学报.PDF
- 基于内存优化的小波零块嵌入图像编码算法-深圳大学.PDF
- 基于准时制的时间成本双目标作业调度优化-东南大学学报.PDF
文档评论(0)