繁體

首页 >> 无人驾驶 >

具有二元奖励的现实世界中的高加速强化学习

2022-06-01 11:44:00 来源：用户：

在机器人中使用深度强化学习可能是预编程动作的更有效替代方法，并使机器人能够执行更具挑战性的任务。但是，在物理系统上学习绝对不能损坏机器人。

最近的一篇论文集中在杂耍两个球的任务上。由于需要高加速度，因此无法进行模拟，并且会发生非线性效应和动态接触。此外，最佳策略无法传递，必须在每个单独的机器人上学习。

该研究表明如何将当前可用的学习方法和工程能力用于此任务。结果表明，该系统能够在56分钟内学习任务。经过逐步改进，它实现了超过4500个重复缓存的重复处理。相比之下，未经训练的人类杂耍者在训练数小时后即可执行约20次接球。

可以在物理世界中学习的机器人对于使机器人能够摆脱僵硬和预先编程的动作至关重要。对于诸如杂耍之类的动态高加速度任务，在现实世界中学习尤其具有挑战性，因为必须在不损害系统的情况下突破机器人及其操作的极限，从而扩大了机器人学习算法的采样效率和安全性。与以前的工作主要侧重于学习算法相反，我们提出了一种学习系统，该系统将这些要求直接纳入策略表示，初始化和优化的设计中。我们证明了该系统使高速Barrett WAM机械手能够利用二进制奖励信号从56分钟的经验中学到两个球。最终政策连续处理长达33分钟或大约4500次重复捕获。记录学习过程和评估的视频可以在以下位置找到：这个https URL

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

分享：

相关阅读

最新文章

合创汽车试驾预约，快速通道开启豪华体验

合创汽车试驾预约，快速通道开启豪华体验。即刻预约，享受专属试驾服务，感受智能科技与极致设计的完美融合。...浏览全文>>
零跑C16试驾全攻略

零跑C16试驾全攻略：零跑C16是一款集智能、空间与性价比于一身的中型SUV。试驾前建议关注其智能座舱系统，支持...浏览全文>>
万象汽车试驾，轻松搞定试驾

万象汽车试驾，轻松搞定试驾。只需几步，即可预约专属试驾体验。登录官网或APP，选择心仪车型，填写基本信息，...浏览全文>>
试驾极氪001，新手必看的详细流程

试驾极氪001前，新手需做好以下准备：首先，提前预约试驾时间，了解车型配置与功能；其次，检查驾驶证、身份证...浏览全文>>
优路教育20周年：二十载坚守，一辈子相伴

职业教育的传承与价值，需在时代发展的逻辑中发展，在技术进步的潮流中进步。二十载的光阴更迭，坚守是优路教...浏览全文>>
试驾五菱凯捷有哪些途径

试驾五菱凯捷可以通过以下几种常见途径进行：1 到店预约试驾消费者可以前往当地的五菱4S店或授权经销商，...浏览全文>>
大力牛魔王试驾全攻略

大力牛魔王试驾全攻略试驾一款新车，尤其是像“大力牛魔王”这样充满科技感的电动车型，需要提前做好充分准备...浏览全文>>
北汽雷驰试驾预约如何快速锁定试驾名额？

想要快速锁定北汽雷驰的试驾名额，您可以采取以下步骤：首先，提前了解北汽雷驰的试驾活动安排。通常品牌会在...浏览全文>>
试驾零跑汽车零跑C01，畅享豪华驾乘，体验卓越性能

试驾零跑汽车零跑C01，感受其带来的豪华驾乘与卓越性能。这款车型以科技感和舒适性为核心卖点，为用户带来全新...浏览全文>>
试驾小鹏P7+，4S店的贴心服务与流程

试驾小鹏P7+是一次令人愉悦的体验，从踏入4S店的那一刻起，就感受到无微不至的服务。工作人员热情迎接，并详细...浏览全文>>

大家爱看

频道推荐

站长推荐