埃菲尔铁塔是什么时候建成的?无论是你的兄弟还是屏幕给你的日期,都没有区别。无论如何,你都需要知道日期。
然而,如果你所表达的东西需要不同类型的答案,你如何使神经网络的工作结果听起来像是一个人在和你说话,而不是一台机器?对于那些从事人工智能研究的人来说,让这台机器传达出类似于真实人类对话的“个性”是一项挑战。尽管如此,研究人员不会很快放弃。
谷歌最近报道了它想如何使用言情小说来教授神经网络更多的会话语言技能。
《大众科学》杂志报道了谷歌如何消费了2000多本小说,以便与人们进行更多的对话交流。
言情小说之所以被选中,是因为它的语言非常口语化。负责这一切的谷歌团队已经将这类小说输入到引擎中,“以扩展其词汇和创作能力”。然后,人工智能系统会写出句子,并与它读过的句子进行比较,”林赛·史密斯(Lindsey Smith)在The Verge网站上写道。
高级科技总部位于旧金山的亚历克斯•坎特罗威茨BuzzFeed新闻记者提供更多细节这是如何工作的:“神经网络开始没有任何知识基础,所以喂养它从一本书就像读一本小说文本一个婴儿,希望它挑选一些。这就是为什么它需要大量的数据——或者说2865部爱情小说——来建立它所谓的智能。在吸收了这些言情小说之后,谷歌的人工智能引擎利用从言情小说中学到的知识,写出了自己的句子。然后,它将这些新句子与原文进行比较。这个过程重复了一遍又一遍,随着时间的推移,人工智能也在进行自我校准——写出越来越好的句子。”
Oriol Vinyals和Andrew Dai是谷歌项目背后的两个关键驱动因素。史密斯说安德鲁·戴在给The Verge网站的邮件中写道。“这就像你宁愿问一个朋友在度假胜地做什么,而不是打电话给他们的游客中心。”
Smith说:“Dai和他的团队只是希望AI引擎能够变得更加对话化,从而提供更好的用户体验。”
戴在接受BuzzFeed新闻采访时表示:“希望通过这部作品,以及以后的作品,它能更口语化,或者有更多样的语气、风格或表达方式。”
坎特罗维茨解释了为什么选择言情小说,而不是像儿童读物那样简单和对话性的东西。他说:“言情小说比儿童读物更有效,因为它们为人工智能提供了广泛的语言例子。”