美国和台湾的研究人员提出了一种不同寻常的人工智能方法来开发全新的蛋白质,这种蛋白质在自然界中从未见过。
图片来源:Design_Cells/Shutterstock.com
该团队使用机器学习来推导蛋白质结构的“音乐计数”,从中可以用来深入训练学习投射全新蛋白质的神经网络。
蛋白质对所有的细胞过程都是必不可少的,仅次于水,是人体组织中最丰富的分子。例如,酶催化代谢所需的生化反应;细胞信号蛋白是控制多种细胞活动所必需的,抗体对细菌和病毒等致病微生物至关重要。蛋白质对于电池对电池的相互作用或电池粘附以及控制电池循环以生产新电池也是必不可少的。
就像生命的公寓楼一样,蛋白质长期以来一直被研究,试图创造出具有所需功能、活动和过程的新分子。
蛋白质是由氨基酸组成的这种形式的多肽——由肽键组成的氨基酸的长序列。然而,决定蛋白质功能的整个3D结构要复杂得多。
从历史上看,科学家们已经通过复制现有的蛋白质或改变蛋白质所组成的氨基酸来开发出新的蛋白质。
然而,已经开发出了物理化学模拟等计算机建模技术,可以根据氨基酸序列生成三维蛋白质结构的模型。
现在,Markus J. Buehler(麻省理工学院)和他在台湾的同事qui Hua Yu利用音乐理论的概念,将蛋白质的化学结构转化为声音,这些声音可以用来学习设计全新的蛋白质。
机器学习是一种人工智能,计算机被用来分析和学习数据,识别模式并自动做出决策,而不需要预先编程,只需要最少的人工输入。
正如美国物理研究所(american institute of physical)出版的《APL生物技术》(APL biotechnology)杂志所报道的那样,布尔赫和他的同事们利用蛋白质中每种氨基酸的不同振动频率来训练一种学习算法来设计新的蛋白质。
由于构成蛋白质的20种氨基酸各有其独特的振动频率,因此整个蛋白质的化学结构可以用音乐理论的核心方面,如旋律和节奏,来清晰地表达出来。
“产生的音乐计数”是根据蛋白质如何折叠在一个深度学习的神经网络中产生的。
这些人工神经网络是一种计算机算法,它模拟人类相互连接的神经元的行为,以类似于大脑处理信息的方式处理和学习大量信息。
比勒解释说:“这些网络学会了理解折叠蛋白在多个时间尺度上说的复杂语言。”“一旦电脑被赋予了一个序列的种子,它就可以通过考虑不同层次的音乐变化——由温度参数控制——来推断和投射出全新的蛋白质。”
然后,比勒和他的同事们将新设计的蛋白质与大型数据库中已知蛋白质中的信息进行了比较。
这项研究“为制造全新的生物材料铺平了道路”
通过应用分子表征和动力学技术,研究小组表明,他们的新方法确实设计了自然界中从未见过的蛋白质。
刚刚发现的蛋白质设计似乎是稳定的和弯曲,Beulher和他的同事开发了一个算法学习音乐可以喝到一场食物蛋白质的海浪的声音来创造物质-一个导演Beulher说“为做全新的有机材料的另一种方式。”
或者,“也许你在自然界中发现了一种酶,你想把它作为一种催化剂来增强它,或者你想出了一种全新的蛋白质变体,”他说。例如,通过改变温度等条件,可以警告算法产生更多的突变,然后可以确定这些突变,以评估哪些酶对合成最有效。
布尔赫还认为,由新蛋白质产生的音乐声音可以用来帮助创作经典歌曲。
在数千年的蛋白质进化过程中,大自然也为我们提供了如何组合和融合声音的新思路。