- 1、本文档共97页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第8章
机器人学习与交互;主要内容;机器人领域的一个重要目标就是让机器人更加适合人类生活环境,更便捷的与人类进行交互协作从而成为人类社会各个领域的重要助手。
在机器人领域,模仿学习(Imitation-learning)作为机器人任务轨迹计划的方法之一,1980年代在机器人领域受到关注,进入21世纪后迅速发展,现在成为机器人领域研究的焦点。;机器人模仿学习也称作示教学习,旨在通过人类示教者提供的示教动作,利用人类示教者演示过程中记录的状态和动作数据集,通过模仿学习的框架,将这些演示自动转换为动作规划;由模仿学习产生的人机交互方式,其关键在于机器人在人机交互的动作技能是由人在人机交互任务中的示范得到的。
机器人能够在不同位置接到人递给他的扳手,在这一技能学习过程中,人重复示范在不同位置递扳手这一动作,通过模仿学习,机器人能够模拟出递扳手这一任务所需要的动作轨迹。;和以往的面向任务编程的方式相比较,模仿学习存在的优点如下:
(1)模仿学习可以让开发者的开发效率变高,一种简单的动作示范即可让机器人掌握一项技能;
(2)模仿学习过程简单,对于开发者来说技术要求比较友好;
(3)模仿学习具有高鲁棒性,能在一定程度上克服工作环境的扰动。;从人类演示中学习机器人的过程基本上分为两个步骤:
人类教学
机器人学习
许多方法和技术,例如基于力传感器的教学,基于视觉系统的教学和基于自然语言的教学,已在人类教学过程中得到开发和实施。
以基于视觉系统的教学为例进行展开描述,具体步骤如下:;(1)人体运动捕捉。通过深度相机采集人体数据前需要对人体骨架进行捕捉。
对人体进行骨架跟踪时,人需要在摄像头面前展示出如图8-2所示的姿势。;(2)训练样本采集。
当进行交互动作的示范时,人和机器人的动作状态需要在各个时间戳上进行采集
在本文中,需要10~20个训练样本来训练一个动作模型
通过对一个任务进行多次的示范,可以将感兴趣的数据记录下来作为该动作模型的训练样本,进而进行训练;(3)人体动作描述。
由于同一动作在不同的训练样本中存在复杂的时空不确定性,所以不能确定例如在空间上具有相同的操作时的运动状态,其总是在一定范围内变化,并且在时间上以相同的操作的每次执行速度是快还是慢造成每个操作样本的时间长度不同。
因此需要通过建立适当的模型对动作进行一般化描述,使得同一个人机交互任务中的动作可以定义为同一动作。;(4)动作轨迹识别。一个任务通常由若干个连贯动作形成,利用每一个动作的若干训练样本,得到相应的动作模型,由此动作轨迹识别的问题就转化为求解若干动作模型形成的运动状态序列,如图8-3所示。;(5)机器人运动生成。
在任务识别完成后,可以推测出机器人的运动轨迹。
由于该任务模型包含了人状态的相关性的统计规律即人体动作描述过程中观测得到的一系列训练样本,因此可以通过该任务模型推测得到机器人的运动。;在推测过程中需要关注观测点的个数,对于只存在一个观测点的情况,虽然推测得到的机器人轨迹与真实轨迹拥有相似的形状,但实际上由于观测较少两者会存在比较大的偏差
当增加一定数量的观测点时,机器人轨迹的推测值会更加接近真实值,并且拥有较好的稳定性。
然而,观测点越多,对人的状态观测时间越长,进行推测的计算难度和时间增大,会一定程度地影响机器人反应速度,使人机交互过程变得不自然。;总的来说,首先制定需要完成的人机交互动作,在人进行示范的过程中,提取出每个动作产生的训练样本,通过对训练样本进行分析处理,保留动作特征,进而建立每个动作的动作模型。
在人机交互过程中,通过已经得到的动作模型对人正在执行的任务进行观测识别,根据识别结果得到机器人运动轨迹,机器人调整自身状态适应轨迹,完成人机交互。;从人类的角度出发,我们可以利用大脑存储大量的知识,这些知识是从过去已经完成过的任务中得到的。
当遇到新任务的时候,大脑对新任务会进行分析,找出哪些是和以前完成过的任务相关联的,进而从历史知识中提取出与新任务相关联的知识,利用这些知识来推进新任务。
提取出的历史知识与新任务的关联性越高,新任务完成的效率和效果就越好。类似这样的学习过程,我们称之为“迁移学习”。;传统的机器学习方法学习模型时需要训练数据集满足一定条件,即数据样本足够多且和测试数据集呈现相同概率分布,但是面对需要解决的实际问题,很难找到满足此条件的数据。
比如对于网络数据,每天的网络数据是和当天的热点话题联系密切,训练数据集包含过去的网页,测试数据集包含当前的网页,两个数据集很难满足相同的概率分布。
针对这种问题,对机器学习时数据需要满足相同概率分布的要求适当降低是解决问题的一种思路,换句话说,不仅仅依赖当前数据,扩展至其他相关数据。;迁移学习可以利用相关领域的可靠数据建立有效的分类模型,属于一种跨领域迁移知识学习的方法。
文档评论(0)