首页 > 科技 > > 正文
2019-11-07 15:44:04

机器人手臂正在玩Jenga

导读 在美国麻省理工学院(MIT)的地下室,一个机器人玩积木 - 因此旨在促进机器人研究。因为机器人手臂学习了一种苛刻的游戏:Jenga。机器人只

在美国麻省理工学院(MIT)的地下室,一个机器人玩积木 - 因此旨在促进机器人研究。因为机器人手臂学习了一种苛刻的游戏:Jenga。机器人只能移除非常特定的块,以便由块组成的塔结构不会坍塌。令人兴奋的是,为了解决这个任务,机器人必须以同样的方式处理视觉和触觉刺激 - 然后它才能理解哪些动作带来了成功。基于这种多感官信息和自己的行为独立学习的能力可以使未来的机器人更具适应性和灵活性。

在游戏“Jenga”中,任务是建造一座54个长方形木块逐渐更高的塔。这里的诀窍是:每个模块必须首先小心地从其中一个较低的塔楼层中溶解,而不会让塔架倾斜。“不同于纯粹的认知任务或游戏,如国际象棋或围棋游戏的Jenga也需要体力的技能,如滑动,测试,布局和块的排列掌握,解释说:”从美国麻省理工学院(MIT)的资深作家阿尔贝托·罗德里格斯。“你需要互动的感知和行动,因为你必须通过仔细触摸塔在哪里以及如何最好地移动一个街区来学习。”

通过概括学习

如果你想使用传统的机器学习方法教这个游戏的机器人,算法需要捕获和测试构建块,塔和机器人之间发生的一切。机器人手臂必须进行数千甚至数万次移动 - 研究人员必须几乎经常重建塔。为了避免这种麻烦,Rodriguez,他的同事Nima Fazeli和他们的团队一直在为他们的机器人寻找更有效的学习策略。他们的方法:类似于人类所做的,机器人的机器大脑应该学习基于一些实验来开发关于块和塔的行为的广义假设。“挑战是从相对少量的实验中学习

机械臂开始在Jenga Tower进行约300次实际试验。使用他的相机,他随机挑选一个块并推或拉它。在每个实验中,他的控制计算机记录了视觉过程,记录了移动块所需的力,以及尝试是否成功结束。现在采取了决定性的步骤:基于这些信息,计算机形成了类似的实验和结果组。对于这些群体中的每一个,他开发了一个模型来帮助他预测积木的行为。例如,他发现一个相对紧密的区块最有可能导致塔楼在拆除时坍塌。

和人类玩家一样好

集群学习策略证明是成功的:机器人手臂他的训练阶段是人类的Jenga球员后切成几乎更糟糕:“我们考察一个人能有多少块平均删除,楼倒塌之前 - 而就是区别从机器人不据麻省理工学院的共同作者米克尔·奥勒报道,特别重要。与使用传统学习算法的机器人模拟相比,机器人手臂甚至将手指放在前面。因为在相同的起始条件下,他的竞争对手需要多个训练单元来同样好地学习游戏。

显示

但是,研究人员指出不创建一个机器人积木大师 - 他们的目标是更广泛的:“有,我们用我们的双手做许多工作,而且我们从哪里键和使用武力决定性结论的感觉画“罗德里格兹解释道。如果将来要使用这些区域的机器人,他们必须能够感觉适当并且能够从触觉刺激中学习。“一个例子是流水线生产智能电话的:约触摸和功率的意义上,而不是仅仅约看到一个旋入的快门的螺钉或搭扣提供的信息的电阻的几乎每个步骤,”研究人员说。“因此,学习此类行为的模型对于此类技术非常重要。”