首页 > 科技 > > 正文
2021-07-02 08:39:41

互联网资讯:Google新工具教AI处理结构化和对抗性数据

导读 互联网是高科技的产物,是历史发展、社会进步、人类智慧的结晶;是人类迄今所拥有的容量最大、内容最广、传递速度最快的信息中心。全球每天
互联网是高科技的产物,是历史发展、社会进步、人类智慧的结晶;是人类迄今所拥有的容量最大、内容最广、传递速度最快的信息中心。全球每天有四亿人使用互联网,上网人数占世界人口的百分之6.互联网为我们了解时事、学习知识、与人沟通、休闲娱乐等提供了便捷的条件,接下来这篇文章给大家说说互联网科技的一角。

Google LLC今天开放了神经结构化学习的源代码,这是其流行的TensorFlow人工智能开发工具包的框架,开发人员可以使用它来训练具有结构化和“对抗性”数据的模型。

AI模型用来处理的大多数文件,例如视频和图像,在技术上都是非结构化数据。但是其他类型的文件仍然在机器学习项目中占有一席之地。以图表形式组织的结构化信息 有助于培训新建的AI模型如何有效识别模式。

Google工程师Da-Cheng Juan和Sujith Ravi 今天在博客文章《神经结构化学习》中解释道:“在训练过程中利用结构化信号可使开发人员获得更高的模型准确性,尤其是在标记数据量相对较小的情况下。”

除了作为一种有用的训练方法外,处理结构化数据对于某些类型的机器学习软件而言也是一项必不可少的任务。科学家在基因组学和分子研究中使用的AI模型通常将结构化图数据作为输入。某些类型的自然语言处理算法也是如此。

神经结构化学习使开发人员只需几行代码就可以将结构化数据合并到项目中。他们只需要准备好AI模型,提供培训记录并指定应根据其组织记录的结构即可。

该框架还允许开发人员指定“隐式”结构来创建所谓的对抗性示例。对抗性示例是恶意文件,例如带有可操纵像素的照片,这些文件看起来与人类没有什么不同,但会绊倒AI并破坏处理结果。在开发过程中将这样的记录扔到机器学习模型上可以教该软件如何抵御攻击。

Google的Da-Cheng Juan和Sujith Ravi写道:“从经验上讲,在没有输入对抗示例的情况下训练的模型会在输入中添加恶意的但人类无法察觉的扰动时,造成极大的准确性损失(例如,降低30%)。” 结果,神经结构化学习对于从事敏感或面向公众的服务的AI团队可能特别方便,这些AI必须解决操纵尝试的可能性。