谁知道Minecraft为人工智能和机器学习算法提供了如此丰富的训练基础?本月早些时候,Facebook研究人员认为热门游戏的限制使其非常适合自然语言理解实验。在一篇新发表的论文中,卡内基梅隆大学的一个团队描述了一个130GB-734GB的语料库,旨在为人工智能开发提供信息 - MineRL--其中包含超过6千万个带注释的状态 - 动作对(记录超过500小时),涉及各种相关的Minecraft任务,与新颖的数据收集方案一起,允许添加任务和收集适用于“各种方法”的完整状态信息。
“正如计算机视觉和自然语言处理社区所证明的那样,大型数据集有能力通过作为新方法的实验和基准平台来促进研究,”共同作者写道。“但是,与强化学习模拟器兼容的现有数据集没有足够的规模,结构和质量,无法进一步开发和评估侧重于使用人类实例的方法。因此,我们引入了一个全面的,大规模的,模拟器配对的人体示范数据集。“
对于那些不熟悉的人来说,Minecraft是一个基于体素的建筑和制作游戏,具有程序创建的世界,包含基于块的树木,山脉,田野,动物,非玩家角色(NPC)等等。块放置在3D体素网格上,并且网格中的每个体素包含一种材料。玩家可以移动,放置或移除不同类型的块,并攻击或抵御来自NPC或其他玩家的攻击。
至于MineRL,它包括六个任务,涉及各种研究挑战,包括多代理交互,长期规划,视觉,控制和导航,以及显式和隐式子任务层次结构。在导航任务中,用户必须移动到具有可变材料类型和几何形状的地形上的随机目标位置,而在砍树目标中,他们的任务是获得木材以生产其他物品。在另一项任务中,玩家被指示生产镐,钻石,熟肉和床等物品,并且在生存任务中,他们必须设计自己的目标并确保物品完成这些目标。
语料库中的每个轨迹包括来自玩家视点的视频帧和来自游戏状态的一组特征,即玩家库存,物品收集事件,目标距离和玩家属性(健康,等级,成就) )。其中补充了元数据,例如用于满足某些目标的时间戳标记,以及由所有键盘按下,由鼠标移动,点击和交互事件以及发送的聊天消息引起的视图俯仰和偏航的变化组成的动作数据。
为了收集轨迹数据,研究人员创建了一个端到端平台,包括一个公共游戏服务器和一个定制的Minecraft客户端插件,记录所有数据包级别的通信,允许重新模拟和重新呈现演示,并修改游戏状态。收集的遥测数据被送入数据处理管道,任务演示自动注释。
研究人员预计,MineRL将支持大规模人工智能一般化研究,通过重新渲染具有不同约束的数据,例如改变照明,摄像机位置和其他视频渲染条件,以及在观察,奖励和行动中注入人工噪声。他们写道:“我们希望它对包括逆强化学习,分层学习和终身学习在内的一系列方法越来越有用。”“我们希望MineRL能够...... [支持]人工智能的许多分支,朝着开发能够解决更广泛的现实环境的方法的共同目标迈进。”