您现在的位置是:首页 >市场 > 2021-04-07 23:42:22 来源:

Google教授机器人如何通过与环境互动来识别对象

谷歌教授人工智能系统更像儿童 - 至少在对象识别和感知方面。在一篇论文(“ Grasp2Vec:来自自我监督的学习的学习对象表示 ”)和随附的博客文章中,Google机器人部门的软件工程师Eric Jang和博士学位的Coline Devin。伯克利大学的学生和前研究实习生描述了一种算法 - Grasp2Vec--通过观察和操纵它来“学习”物体的特征。

Google教授机器人如何通过与环境互动来识别对象

他们的工作是在旧金山的初创公司OpenAI展示计算机视觉系统几个月之后 - 被称为Dense Object Nets,简称DON,它允许机器人检查,视觉理解和操纵他们从未见过的物体。谷歌研究人员解释说,它基于对自我监督的认知发展研究。

人们通过与环境相互作用获得关于世界的知识,经过时间考验的对象持久性研究已经显示出来,并且随着时间的推移从他们所采取的行动的结果中学习。即使抓住一个物体也能提供很多关于它的信息 - 例如,它必须在导致掌握的时刻触手可及。

“在机器人领域,这种类型的...学习正在积极研究,因为它使机器人系统能够在不需要大量训练数据或人工监督的情况下学习,”Jang和Devin写道。“通过使用这种形式的自我监督,[类似机器]机器人可以通过...场景中的视觉变化来学习识别......对象[s]。”

该团队与X Robotics合作,“教导”一个能够“无意间”抓住物体的机器人手臂,并在训练过程中学习各种物体的表现。这些陈述最终导致“有意识地”掌握研究人员选择的工具和玩具。

该团队利用强化学习 - 一种人工智能培训技术,使用奖励系统驱动代理人达到特定目标 - 鼓励手臂抓住物体,用相机检查物体,并回答基本的物体识别问题(“这些物体是否匹配? “)。他们实施了一种感知系统,可以通过分析一系列三个图像来提取有关项目的有意义的信息:抓取前的图像,抓取后的图像,以及抓取对象的孤立视图。

在测试中,Grasp2Vec和研究人员的新颖策略取得了80%%的成功率,即使在多个对象与目标匹配且目标由多个对象组成的情况下也能工作。

“我们展示了机器人抓取技能如何能够生成用于学习以对象为中心的表示的数据,”他们写道。“然后,我们可以使用表示学习'引导'更复杂的技能,如实例抓取,同时保留我们自主抓取系统的自我监督学习属性。展望未来,我们不仅对通过更好的感知和控制可以为机器人技术带来什么样的机器学习感到兴奋,而且还为机器人技术在新的自我监督范式中为机器学习带来了什么感到兴奋。