- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2017年IEEE国际机器人与自动化会议(ICRA)新加坡,‑6月3日
协同人机任务执行中的偏好学习
123
蒂博·蒙泽,图桑特和曼努埃尔·洛佩斯
SuperiorT´ecnico的成员manuel.lopes@tecnico.ulisboa.pt
—我们提出了一种新方法,在并发的人机联合任务执
行过程中学习人类的偏好。我们考虑的任务是由一名人类操作
员和一个机器人助手组成的团队实现的,该机器人助手应适应
人类的任务执行偏好。不同的操作员可能具有不同的能力、经
验和个人偏好,因此在团队中对活动的特定分配可能优于其他
分配。
并发多智能体合作的行为建模为半决策过
程,并展示了如何对团队行为的人类偏好进行建模和学习。在
提出两种不同的交互式学习算法后,我们对其进行了评估,结
果表明系统可以有效地学习并适应人类的偏好。
I.引言
机器人技术正在发展到我们现在可以实现紧密的人
机协作的程度。这开启了人们和机器人共同工作的许多
新的协作应用。在这种情况下,机器人可以具有简单的
重复行为,让用户适应它们,或者具备推理能力,成为
真正的团队成员。真正的协作涉及共享决策、相互支持
以及轻松互动和表达偏好的方式。
在这项工作中,我们希望探索这种直观的合作,其
中机器人不仅与用户共同执行共享任务,还以用户偏好
的方式执行。这些偏好是在一个直观的交互循环中学习
的。
我们采用这种方法是因为为了提高舒适度、效率、
接受度以及减少身体疲劳,应该是机器人学习和适应人
类的偏好,而不是相反。这些偏好在任务执行过程中学
习,以避免任务编程的周期,从而促进任务切换。
的研究考虑了偏好学习和模仿学习,但主要是
在单个任务的背景下。在本文中,我们提出了几种
不同的方法来学协同任务执行过程中对并发动作的
偏好。我们的贡献包括以下几点:i)使用关系活动过程
(RAPs)建模团队行为的形式化方法[1];ii)使用
MDP工具表示偏好的形式化方法;iii)两种不同的算法
来交互式地学习偏好。我们在仿真和机器人上展示
了结果。
12
ThibautMunzer是法国Inria的成员MarcToussaint是德国
3
USTT的成员ManuelLopes是葡萄牙INESC‑ID、Instituto
可能比需要的多,甚至可能无法涵盖任务的关键方面。
为了解决这些问题,提出了将两个阶段合并的交互场
景。在[2],中,机器人仅在某个状态下对行动的信心低
于给定阈值时才进行查询。另法是[7],系统请
求有关重要状态的信息以学习代表任务的良好。其
他方法则在两个阶段之间平滑过渡,首先是通过远
图1.工具箱领域。如果协作机器人通过新零件并固定零件位程操作学习策略[8],或偏好[9],,并且在任何时候用
置来帮助用户,使拧螺丝更容易,那么盒子可以更轻松高效地组
户都可以恢复操作以纠正。
装。
您可能关注的文档
- 空调过程与循环:湿空气热力学性质研究.pdf
- 复试导师邮件模板及要点.pdf
- 亚洲地理概览与分析——位置、地形及河流关系.pdf
- 文化史发展节奏与转型.pdf
- 你复习:以M5课程为例复习计划模板.pdf
- 第2课时去括号解一元一次方程.pdf
- 飞利浦手262详细参数与特色功能介绍.pdf
- 德国音乐零售商及店铺地址电话汇总.pdf
- 抗心绞痛药物临床应用与作用机制分析.pdf
- 企业国际化营战略与全球价值链中角色及升级路径.pdf
- 铁道客车净水箱热分析仿真及试验对比.pdf
- 铁道车辆热铆连接的疲劳可靠性分析.pdf
- 天线指向机构减振设计与试验研究.pdf
- 山东省济南第一中学2025-2026学年高一上学期1月学情检测化学试题含答案.pdf
- 四川省南充市仪陇中学2025-2026学年高一上学期12月月考试题 政治含答案.pdf
- 金太阳河南省南阳地区2025-2026学年高一上学期12月阶段考试卷英语(26-176A)(含答案).docx
- 金太阳河南省南阳地区2025-2026学年高二上学期12月阶段考试卷英语(26-176B)(含答案).docx
- 河南省濮阳市第一高级中学2025-2026学年高二上学期1月月考政治试题(含答案).pdf
- 四川省南充市仪陇中学2025-2026学年高一上学期12月月考试题 政治含答案.docx
- 陕西省宝鸡市2026年高三高考模拟检测试题(一)物理试卷+答案.docx
最近下载
- 学科大概念视域下初中语文单元教学路径构建研究.docx VIP
- 防腐除锈标准.pdf VIP
- 化疗前后手足冰敷操作流程.docx VIP
- GB_T 17888.3-2020 机械安全 接近机械的固定设施 第3部分:楼梯、阶梯和护栏.pdf
- 4026-2019 人机界面标志标识的基本和安全规则 设备端子、导体终端和导体的标识..docx VIP
- T超滤+反渗透+EDI方案.docx VIP
- 2025及以后5年中国烧碱行业市场行情动态及投资前景分析报告.docx
- 01 iso 19840-2004 中文 色漆和清漆—粗糙面上干膜厚度的测量和验收准则.pdf VIP
- 民航安全检查员四级理论考试题库及答案.docx VIP
- 变更公司经营范围的股东会决议.docx VIP
原创力文档


文档评论(0)