基于下肢传感器信号的通用价值函数的自适应行走控制分层强化学习框架-计算机科学-机器学习-强化学习-康复技术.pdfVIP

基于下肢传感器信号的通用价值函数的自适应行走控制分层强化学习框架-计算机科学-机器学习-强化学习-康复技术.pdf

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于下肢传感器信号的通用价值函数的自适应行走控制分层强化学习

框架

SonnyT.JonesGrangeM.Simpson

DepartmentofBiomedicalEngineeringDepartmentofBiomedicalEngineering

UniversityofUtahUniversityofUtah

sonny.jones@grange.simpson@

PatrickM.PilarskiAshleyN.Dalrymple

AlbertaMachineIntelligenceInstitute(Amii)DepartmentofBiomedicalEngineering

DepartmentofMedicineDepartmentofPhysicalMedicineandRehabilitation

DepartmentofComputingScienceUniversityofUtah

本UniversityofAlbertaashley.dalrymple@

译pilarski@ualberta.ca

1Abstract

v

3

8康复技术是研究人类和机器代理共享学习与决策的自然环境。在这项工作中,我们探讨了分层强化学习(HRL)的应用,

9以开发适应性控制策略来改进下肢外骨骼,旨在提高运动障碍个体的移动性和自主性。受到生物学感觉运动处理突出模型

6的启发,我们的研究HRL方法将复杂任务分解为高层框架,用于地形策略适应和低层框架,提供预测信息;这一元素通过

1

.持续学习一般价值函数(GVFs)实现。GVFs生成来自多个可穿戴下肢传感器(包括肌电图、压力鞋垫和角度计)的未来

7

0信号值的时间抽象。我们研究了两种方法将实际和预测的传感器信号整合到策略网络中,意图提高跨不同地形行走时下肢

5外骨骼控制系统决策能力。一个关键结果是,来自GVFs的预测增加了整体网络准确性。在平坦地面、不平地面、上坡和

2

:下坡以及转弯等经常被误分类的地面上行走时,特定地形性能有所提高。这表明预测信息可以在不确定性期间帮助决策,

v

i例如在有高几率被误分类的地形上。因此,这项工作为HRL的细微差别提供了新的见解,并为促进安全穿越不同步行环

x境的外骨骼未来开发做出了贡献。

r

a

Keywords:分层强化学习,持续深度学习,通用价值函数,外骨骼,行走

Acknowledgements

此项工作得到了生物医学工程系和物理医学与康复系的支持。STJ获得了来自工程学院的Campbell捐赠研究生奖学金的

支持。PMP获得了NSERC、Amii和加拿大CIFAR人工智能讲席计划的支持。

1介绍

下肢外骨骼有潜力帮助患有各种神经肌肉缺陷(包括中风和脊髓损伤)的人恢复行走能力[1]。日常社区步行需要能够调整

步态以适应环境特征和行进地形的能力[2]。然而,目前的外骨骼控制器不具备自适应性,依赖用户手动物理输入来切换不

同的固定控制策略,限制了它们在实际使用中的效果[3]。有必要开发自适应外骨骼控制器以帮助安全过渡和穿越可变地

形。为辅助设备开发这些控制策略可以增强因运动功能障碍而受到影响的个体的整体自主性和移动性。

分层强化学习(HRL)通过将复杂任务分解为多个随时间可适应的较简单子任务,提供了一种简化这些任务的有前景的方

法。先前的工作利用了一个由通用价值函数(GVFs)和RL代理组成的架构来进行Android环境中的手势控制决策[4]。我

们采用HRL方法将控制问题分解为两个组成部分:1)高层框架自适应预测个体行走的地貌;2)提供下肢传感器信号的预

测信息以通用价值函数形式给高层框架以进行

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档