机器人可以拾取任何物体

导读人类长期以来一直是灵巧的主人，这种技能在很大程度上归功于我们眼中的帮助。与此同时，机器人仍在迎头赶上。当然有一些进步：几十年来，在

人类长期以来一直是灵巧的主人，这种技能在很大程度上归功于我们眼中的帮助。与此同时，机器人仍在迎头赶上。当然有一些进步：几十年来，在装配线等受控环境中的机器人能够一次又一次地拾取同一物体。

最近，计算机视觉的突破使机器人能够在物体之间做出基本的区分，但即使这样，它们也不能真正理解物体的形状，因此在快速拾取后它们几乎无法做到。

麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员在一篇新论文中说，他们已经在这个工作领域做了一个重要的发展：一个让机器人能够检查随机物体并在视觉上理解它们以完成具体工作的系统。没有见过他们的任务。

该系统被称为“密集对象网”(DON)，它将对象视为点的集合，作为各种“视觉路线图”。这种方法可以让机器人更好地理解和操纵物品，最重要的是，它们甚至允许他们在类似物体的混乱中拾取特定物体 - 这是亚马逊和沃尔玛等公司在其仓库中使用的各种机器的宝贵技能。

例如，有人可能会使用DON让机器人抓住物体上的特定位置 - 例如鞋子的舌头。从那以后，它可以看到它以前从未见过的鞋子，并成功抓住它的舌头。

“许多操纵方法无法识别物体可能遇到的多个方向的物体的特定部分，”博士生Lucas Manuelli说道，他与主要作者和博士生Pete Florence一起撰写了一篇关于该系统的新论文，与麻省理工学院一起Russ Tedrake教授。“例如，现有算法无法通过手柄抓住马克杯，特别是如果马克杯可能处于多个方向，如直立或侧面。”

该团队不仅在制造环境中，而且在家庭中都看到了潜在的应用。想象一下，给系统一个整洁的房子的图像，让你在工作时清洁，或使用菜肴的图像，以便系统在你度假时把你的盘子放好。

还值得注意的是，没有一个数据实际上被人类标记过;相反，该系统是“自我监督的”，因此它不需要任何人类注释。

让它易于掌握

机器人抓取的两种常见方法涉及任务特定学习或创建一般抓取算法。这些技术都有障碍：特定于任务的方法难以推广到其他任务，并且一般的掌握不足以处理特定任务的细微差别，例如将对象放在特定位置。

然而，DON系统基本上在给定物体上创建一系列坐标，作为物体的一种“视觉路线图”，使机器人更好地理解它需要掌握的内容，以及在哪里。

该团队训练系统将对象视为构成较大坐标系的一系列点。然后，它可以将不同的点映射到一起以可视化对象的三维形状，类似于从多张照片拼接全景照片的方式。训练之后，如果一个人指定一个物体上的一个点，机器人可以拍摄该物体的照片，并识别和匹配点，然后能够在该指定点拾取物体。

这与UC-Berkeley的DexNet系统不同，它可以掌握许多不同的项目，但不能满足特定的要求。想象一下，一个18个月大的婴儿，他不明白你想要它玩哪个玩具，但仍然可以抓住很多物品，而一个四岁的孩子可以回应“在红色的末端抓住你的卡车它。”

在软毛虫玩具上进行的一组测试中，由DON驱动的Kuka机器人手臂可以从一系列不同的配置中抓住玩具的右耳。这表明，除其他外，系统具有在对称物体上区分左右的能力。

当在不同棒球帽的箱子上进行测试时，尽管所有的帽子都具有非常相似的设计，但是DON可以挑选出特定的目标帽子 - 并且以前从未在训练数据中看过帽子的照片。

“在工厂中，机器人通常需要复杂的零件供料器才能可靠地工作，”Manuelli说。“但是像这样能够理解物体方向的系统可以拍摄照片，并能够相应地掌握和调整物体。”

在未来，团队希望将系统改进到能够执行特定任务的地方，同时更深入地了解相应的对象，例如学习如何抓住对象并以最终目标移动它，清理桌面。

该团队将于下个月在瑞士苏黎世举行的机器人学习会议上发表论文。