您现在的位置是:首页 >人工智能 > 2022-06-30 16:27:49 来源:

假数据帮助机器人更快地学习绳索

导读 在朝着可以像人类一样动态学习的机器人迈出一步,一种新方法扩展了机器人的训练数据集,这些机器人可以处理绳索和织物等软物体,或者在杂乱

在朝着可以像人类一样动态学习的机器人迈出一步,一种新方法扩展了机器人的训练数据集,这些机器人可以处理绳索和织物等软物体,或者在杂乱的环境中工作。

由密歇根大学的机器人研究人员开发,它可以将学习新材料和环境的时间缩短到几个小时,而不是一两个星期。

在模拟中,扩展的训练数据集将机器人在发动机组上绕绳子的成功率提高了40%以上,并且几乎使物理机器人在类似任务中的成功率提高了一倍。

这项任务是机器人机械师需要能够轻松完成的任务之一。但是,使用今天的方法,学习如何操作每条不熟悉的软管或皮带,将需要大量数据,可能需要数天或数周的时间收集,UM机器人学副教授、今天在Robotics:Science上发表的一篇论文的高级作者DmitryBerenson说和纽约市的系统。

在那段时间里,机器人会玩弄软管——拉伸它,把两端放在一起,绕过障碍物等等——直到它理解软管可以移动的所有方式。

“如果机器人需要长时间使用软管才能安装它,那么这对于许多应用程序都不起作用,”贝伦森说。

事实上,人类机械师可能不会对需要这种时间的机器人同事印象深刻。因此,Berenson和机器人学博士生PeterMitrano对优化算法进行了改造,以使计算机能够做出我们人类所做的一些概括——预测在一个实例中观察到的动态如何在其他实例中重复。

在一个示例中,机器人在拥挤的表面上推动圆柱体。在某些情况下,圆柱体没有撞到任何东西,而在其他情况下,它与其他圆柱体相撞,它们会相应地移动。

如果圆柱体没有碰到任何东西,那么该运动可以在桌子上的任何地方重复,其中轨迹不会将它带入其他圆柱体。这对人类来说是直观的,但机器人需要获取这些数据。与其进行耗时的实验,Mitrano和Berenson的程序可以对第一个实验的结果产生变化,以同样的方式为机器人服务。

他们专注于伪造数据的三个品质。它必须是相关的、多样化的和有效的。例如,如果您只关心机器人在桌子上移动气缸,那么地板上的数据就无关紧要了。另一方面是数据必须是多样化的——表格的所有部分,所有角度都必须进行探索。

“如果你最大化数据的多样性,它就不够相关。但如果你最大化相关性,它就没有足够的多样性,”米特拉诺说。“两者都很重要。”

最后,数据必须有效。例如,任何具有两个圆柱体占据相同空间的模拟都是无效的,需要将其标识为无效,以便机器人知道不会发生这种情况。

对于绳索模拟和实验,Mitrano和Berenson通过将绳索的位置外推到物理空间的虚拟版本中的其他位置来扩展数据集——只要绳索的行为方式与初始实例中的相同.仅使用初始训练数据,模拟机器人在48%的时间内将绳索钩在发动机缸体上。在对增强数据集进行训练后,机器人成功率达到了70%。

一项用真实机器人探索动态学习的实验表明,使机器人能够以这种方式扩展每次尝试,在30次尝试过程中其成功率几乎翻倍,成功尝试是13次而不是7次。