- 0
- 0
- 约9.01千字
- 约 9页
- 2023-06-09 发布于四川
- 举报
本发明公开了一种面向行为克隆的示范主动采样方法。行为克隆是一类典型的模仿学习算法,该算法在自动驾驶领域得到了广泛的关注。现有的行为克隆算法为了训练有效的策略,需要专家提供大量的示范。然而在实际任务中,提供示范的代价是高昂的,高昂的代价限制了行为克隆方法的应用。主动学习通过挑选最有价值的样本进行标注可以有效的减少标注代价。本发明利用主动学习,从状态候选集中挑选最具价值的状态作为起始状态,然后让专家从起始状态开始做示范,并返回固定长度的轨迹,可以使得示范的价值最大,从而有效的减少示范的代价。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112906868 A
(43)申请公布日 2021.06.04
(21)申请号 202110248762.3
(22)申请日 2021.03.08
(71)申请人 南京航空航天大学
地址
您可能关注的文档
- 一种热封铝膜展开输送装置及开启装置.pdf
- 一种控制焊接等离子弧热源输出分布的装置及方法.pdf
- 用于活体检测的方法、电子电路、电子设备和介质.pdf
- 室内设备布置图生成方法、装置、电子设备和存储介质.pdf
- 一种基于睡眠脑网络的抑郁症患者数据分类方法及装置.pdf
- 施工任务处理方法、电子设备及存储介质.pdf
- 一种用于测量高温下纵波声速的装置及方法.pdf
- 一种切丝系统中喂料料位高度的自动控制方法及切丝系统.pdf
- 五波段目标辐射便携式激光模拟装置及方法.pdf
- 一种滤棒发射单元及零配件移动清洁装置.pdf
- 基于光量子计算机的电网停电后分区模型及量子比特扩容方法.pdf
- 基于量子纠缠光源的椭圆偏振测量技术研究进展.pdf
- 量子博弈:美国在量子信息科技领域的对华竞争.pdf
- 济南市一次污染传输过程中的光量子雷达联合组网监测.pdf
- 用大学物理知识诠释前沿科技——从光的偏振到量子通信.pdf
- 面向公众的前沿科学可视化传播策略研究——以量子科技领域为例.pdf
- 我国量子产业专利池构建对策研究——基于安徽省“量子高地”分析.pdf
- 颠覆性技术如何突围:量子科技崛起背后的多源流耦合逻辑 (1).pdf
- 基于HHL算法的量子牛顿-拉夫逊法潮流计算.pdf
- 欧洲未来产业布局战略及对我国的启示——基于《量子技术计划:战略路线图》的跨界整合式创新研究.pdf
最近下载
- 西部证券-汽车出海行业深度报告-汽车出海前景广阔,中国车企份额持续提升.pdf VIP
- 2025年广东省广州市中考化学真题卷含答案解析.docx VIP
- 吉林省2024年中考数学试卷【附参考答案】.pdf VIP
- 2025年走进军事理论空军工程大学章节及期末答案.docx VIP
- 2023铁路5G-R可视技术应用白皮书.doc VIP
- 2025国省考季-行测(事业编D类)理论攻坚(理论课)言语理解与表达2(讲义+笔记).pdf VIP
- 陕西专技2026公需课《立足新阶段、抢抓新机遇党的二十届四中全会精神与“十五五”战略机遇解读》20学时完整题库及答案.docx VIP
- 2025年宜宾国企考试真题及答案.doc VIP
- 2023年广东省广州市中考语文试题(含答案解析) .pdf VIP
- 2026年高考新课标一卷英语真题试卷.docx
原创力文档

文档评论(0)