今天,脸书研究公司推出了试剂,这是一个增强的学习工具包,用于构建可以接收反馈的决策人工智能。试剂可以为用户操作分配分数,并使用用户输入(如点击推荐内容)作为训练数据。
试剂是一个小的C库,可以从GitHub下载。该库旨在嵌入到任何应用程序中。该工具包附带了一组入门级决策AI模型、一个用于模型性能评估的离线模块,以及一个使用PyTorch中的TorchScript库将AI部署到生产中的平台。
Horizo n是一个强化学习平台,用于在2018年11月脸书开源生产中部署大型模型,现在已经成为了试剂的一部分。
研究负责人斯里尼瓦斯纳拉亚南(Srinivas Narayanan)今天在脸书的@Scale会议上表示,目前每天都有数十亿个关于脸书的决定被用来个性化,比如脸书和Instagram的用户通知。它还被用于机器人研究,教机器如何行走。
脸书在博客中表示:“它是创建基于AI的推理系统最全面、最模块化的开源平台,也是第一个包含策略评估的策略,它结合了线下反馈来改进模型。”“通过简化实时、大规模决策模型的构建,试剂使研究项目和生产应用中策略的创建和评估民主化。
为了继续改进试剂,脸书发布了如何部署到微软Azure等云服务的文档。微软Azure认知服务在今年年初推出了自己的强化学习服务。
这一消息是在脸书PyTorch开发者大会一周后发布的,会上该公司推出了Captum,一种用于解释机器学习的工具。
今年夏天,在VentureBeat的Transform大会上的一次对话中,OpenAI首席技术官格雷格布罗克曼(Greg Brockman)和首席科学家伊利亚萨特斯基弗(Ilya Sutskever)认为,推理和可解释性应该是未来AI模型的核心。