一看就会!英伟达新研究教机器人仅通过观察人类行为完成任务

简介: NVIDIA的研究人员开发了第一个可以教机器人仅通过观察人类的行为来完成任务的深度学习系统。该方法利用合成数据来训练神经网络,是第一次在机器人上使用以图像为中心的域随机化方法。

来自NVIDIA的研究人员开发了一个基于深度学习的系统,该系统可以教机器人仅通过观察人类的行为来完成任务。该方法旨在加强人与机器人之间的交流,同时进一步研究如何使人类无缝地与机器人一起工作。这是第一个这样的系统,研究由Stan Birchfield和Jonathan Tremblay领导。

“要想让机器人在现实世界中执行有用的任务,必须要能很容易地将任务传达给机器人。这包括预期的结果以及任何关于达到该结果的最佳方法的提示。”研究人员在他们的研究报告中指出。“通过演示,用户可以将任务传达给机器人,并向机器人提供如何以最佳的方式执行任务的线索。”

研究人员使用NVIDIA TITAN X GPU训练了一系列神经网络来执行与感知、程序生成和程序执行相关的任务。结果显示,机器人能够通过观察现实世界的单个演示来学习任务

336b1d38b0151efd9be94f41fe19a4d06d846d26

该方法的工作方式:一个摄像机被用来捕获场景的实时视频流,并且通过两个神经网络实时地对场景中对象的位置和关系进行推断。由此产生的知觉被输入到另一个网络中,该网络生成一个解释如何重建这些感知的计划。 最后,一个执行网络读取该计划并为机器人生成动作,同时考虑到当前场景的状态,以确保对外部干扰的稳健性。

一旦机器人得到一个任务,它就会生成一个人类可读取的关于重新执行该任务所需步骤的描述。该描述让用户能够在机器人执行之前快速识别和纠正机器人对人类演示的解释中的问题。

实现这种能力的关键是利用合成数据来训练神经网络。目前训练神经网络的方法需要大量有标记的训练数据,这对这类系统来说是一个瓶颈。通过合成数据生成,不用太费力就可以生成几乎无限的标记训练数据。

这也是第一次在机器人上使用以图像为中心的域随机化方法。域随机化(domain randomization)是一种产生大量多样性的合成数据的技术,然后愚弄感知网络将真实界的数据看作是其训练数据的另一种变体。研究人员选择以图像为中心的方式处理数据,以确保网络不依赖于摄像机或环境。

研究人员说:“如描述所示,这个感知网络适用于任何固态的现实世界物体,这些物体可以通过其3D边界立方体(bounding cuboid)来模拟。”“尽管训练过程中从未观察到真实的图像,但感知网络能够在真实图像中可靠地检测到物体的bounding cuboid,即使在有严重的遮挡的情况下也是如此。”

在他们的演示中,研究团队用几个彩色积木和一辆玩具汽车训练目标检测器。系统被教授“块”(blocks)的物理关系,不管这些“块”是堆叠在一起还是彼此相邻放置。

24c9c00eb23bb26e4f4725b0cd88cef8d6a6cc84

在上面的演示视频中,人类操作员向机器人展示了一组立方块。系统然后推断一个适当的程序并按正确的顺序将立方块正确地放置好。因为它在执行过程中会考虑当前世界的状态,因此系统能够实时地从错误中恢复过来。

研究人员将在本周于澳大利亚布里斯班举行的机器人与自动化国际会议(ICRA)上发表他们的研究论文和工作。

该团队表示,他们将继续探索使用合成训练数据进行机器人操纵,以将他们的方法扩展到其他场景。


原文发布时间为:2018-05-23

本文作者:肖琴

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:一看就会!英伟达新研究教机器人仅通过观察人类行为完成任务

相关文章
|
5月前
|
传感器 算法 安全
【四旋翼飞行器】【模拟悬链机器人的动态】设计和控制由两个四旋翼飞行器推动的缆绳研究(Matlab代码实现)
【四旋翼飞行器】【模拟悬链机器人的动态】设计和控制由两个四旋翼飞行器推动的缆绳研究(Matlab代码实现)
129 0
|
5月前
|
算法 机器人 Serverless
【机器人路径规划】基于6种算法(黑翅鸢优化算法BKA、SSA、MSA、RTH、TROA、COA)求解机器人路径规划研究(Matlab代码实现)
【机器人路径规划】基于6种算法(黑翅鸢优化算法BKA、SSA、MSA、RTH、TROA、COA)求解机器人路径规划研究(Matlab代码实现)
590 2
|
5月前
|
机器学习/深度学习 算法 机器人
【机器人路径规划】基于A*算法的机器人路径规划研究(Python代码实现)
【机器人路径规划】基于A*算法的机器人路径规划研究(Python代码实现)
720 4
|
5月前
|
算法 安全 机器人
【路径规划】基于遗传算法结合粒子群算法求解机器人在复杂不同类型下的路径规划研究(Matlab代码实现)
【路径规划】基于遗传算法结合粒子群算法求解机器人在复杂不同类型下的路径规划研究(Matlab代码实现)
158 4
|
5月前
|
机器学习/深度学习 存储 算法
【水下机器人建模】基于QLearning自适应强化学习PID控制器在AUV中的应用研究(Matlab代码实现)
【水下机器人建模】基于QLearning自适应强化学习PID控制器在AUV中的应用研究(Matlab代码实现)
399 0
|
6月前
|
传感器 算法 安全
【路径规划】基于matlab A_Star结合DWA算法电气设备巡检机器人路径规划研究(Matlab代码实现)
【路径规划】基于matlab A_Star结合DWA算法电气设备巡检机器人路径规划研究(Matlab代码实现)
199 0
|
12月前
|
传感器 人工智能 机器人
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
748 1
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
|
12月前
|
机器学习/深度学习 人工智能 算法
ToddlerBot:告别百万经费!6000刀就能造人形机器人,斯坦福开源全套方案普及机器人研究
ToddlerBot 是斯坦福大学推出的低成本开源人形机器人平台,支持强化学习、模仿学习和零样本模拟到现实转移,适用于运动操作研究和多场景应用。
1202 3
ToddlerBot:告别百万经费!6000刀就能造人形机器人,斯坦福开源全套方案普及机器人研究
|
数据采集 人工智能 算法
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
Seer是由上海AI实验室与北大等机构联合推出的端到端操作模型,结合视觉预测与动作执行,显著提升机器人任务成功率。
603 20
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
|
人工智能 自动驾驶 安全
Cosmos:英伟达生成式世界基础模型平台,加速自动驾驶与机器人开发
Cosmos 是英伟达推出的生成式世界基础模型平台,旨在加速物理人工智能系统的发展,特别是在自动驾驶和机器人领域。
1135 15
Cosmos:英伟达生成式世界基础模型平台,加速自动驾驶与机器人开发

热门文章

最新文章