蛋白质设计新时代！Science：开发出基于强化学习的蛋白结构设计方法

在一项新的研究中，来自美国华盛顿大学的研究人员成功地将强化学习（reinforcement learning）应用于分子生物学的挑战。他们开发出一种强大的新蛋白设计软件，该软件改编自一种在国际象棋和围棋等棋盘游戏中被证明是擅长的策略。在一项实验中，用这种新方法制造的蛋白被发现能更有效地在小鼠体内产生有用的抗体。这一突破可能很快会带来更有效的疫苗。更广泛地说，这种方法可能导致蛋白设计的新时代。相关研究结果发表在2023年4月21日的Science期刊上，论文标题为“Top-down design of protein architectures with reinforcement learning”。

论文共同通讯作者、华盛顿大学医学院生物化学教授David Baker说，“我们的研究结果表明，强化学习可以做的不仅仅是掌握棋盘游戏。当训练解决蛋白科学中长期存在的难题时，该软件在构建有用分子方面表现出色。如果把这种方法应用到正确的研究问题上，它可能加速各种科学领域的进步。”

这项新的研究是利用人工智能进行蛋白科学研究的一个里程碑。潜在的应用是巨大的，从开发更有效的癌症治疗方法到合成新的可生物降解的纺织品。

强化学习是一种机器学习，在这种机器学习中，计算机程序通过尝试不同的行动和接受反馈来学习作出决定。例如，这样的算法可以通过测试棋盘上导致胜利或失败的数百万种不同走法来学习下棋。该程序旨在从这些经验中学习，并随着时间的推移变得更善于作出决定。

为了开发一种用于蛋白设计的强化学习程序，这些作者给计算机提供了数百万种简单的起始分子。然后，该软件进行了一万次尝试，随机改进每种分子，使其达到预定的目标。计算机延长了蛋白的长度或以特定的方式让它们弯曲，直到它学会如何将它们扭曲成所需的形状。

论文共同第一作者、Baker实验室的Isaac D. Lutz解释说，“我们的方法是独特的，因为我们使用强化学习来解决构建蛋白形状的问题，这些蛋白的形状像拼图一样组合在一起。这在以前的方法中是不可能实现的，并且有可能改变我们可以构建的分子类型。”

作为这项新研究的一部分，这些作者在实验室里制造了数百种人工智能设计的蛋白。通过使用电子显微镜和其他仪器，他们证实了许多由计算机构建的蛋白形状确实在实验室里实现了。

论文共同通讯作者兼论文共同第一作者、华盛顿大学医学蛋白设计研究所博士后学者Shunzhi Wang说，“这种方法被证明不仅准确，而且高度可定制。例如，我们要求该软件制作没有孔、小孔或大孔的球形结构。它制作各种结构的潜力还有待充分挖掘。”

这些作者专注于设计由许多蛋白分子组成的新纳米级结构。这需要同时设计蛋白成分本身和允许纳米结构自我组装的化学界面。

电子显微镜证实，许多人工智能设计的纳米结构能够在实验室中形成。作为衡量这种设计软件变得多么精确的措施，科学家们观察到许多独特的每个原子都被发现在预定位置的纳米结构。换句话说，预期的纳米结构和他们在实验室实现的纳米结构之间的偏差平均小于一个原子的宽度。这就是所谓的原子精确设计。

图片来自Science, 2023, doi:10.1126/science.adf6591。

这些作者预见到，在未来，这种方法可以使他们和其他人制造治疗性蛋白、疫苗和其他以前的方法是无法制造的的分子。

这些作者利用血管细胞的原代细胞模型发现，利用这种新方法所设计的蛋白支架的性能优于以前的技术版本。例如，由于帮助细胞接收和解释信号的受体更密集地聚集在这些更紧凑的蛋白支架上，它们在促进血管稳定方面更有效。

论文共同作者、华盛顿大学医学院生物化学教授Hannele Ruohola-Baker谈到了这项新的研究对再生医学的影响：“该技术越精确，就越能开辟出潜在的应用，包括对糖尿病、脑损伤、中风和其他血管受到威胁的疾病进行的血管治疗。我们还可以想象，我们用来将干细胞分化成多种细胞类型的因子的递送更加精确，提供了调节细胞发育和老化过程的新方法。”

参考资料：

Isaac D. Lutz et al. Top-down design of protein architectures with reinforcement learning. Science, 2023, doi:10.1126/science.adf6591.