- A+
推荐一篇发布在Nature Methods上的文章,文章标题“Atom-level enzyme active site scaffolding using RFdiffusion2”。文章的通讯作者是来自华盛顿大学的David Baker和Rohith Krishna。其中David Baker课题组主要从事蛋白质涉及相关的研究。

设计催化新反应的酶是蛋白设计领域中一个艰巨的任务。对于酶设计问题而言,起点通常是已知一个活性位点在反应过渡态时的相关信息:包括体系的化学组成(功能残基和辅因子)以及对应的几何结构。以上这些信息构成了一个酶的雏形,即“理论酶”(theozyme)。酶的设计问题就是生成能够容纳一个理论酶的蛋白质。此前的方法如RosettaMatch从已知的或设计的支架中寻找能够放置催化残基的结构。生成式深度学习方法如RFdiffusion则大大拓展了可能的支架,然而这些方法对于输入仍存在一些约束:只能以主链结构表示理论酶中的残基;需要提供残基在主链上的位置。这一方面增加了从理论酶结构到设计输入结构的处理步骤和计算耗时,另一方面也损失了理论酶中的原子级motif信息。本文,作者发展了RFdiffusion2,它能够在原子级层面上描述活性位点,从而有望提升模型在酶设计问题上的表现。

为此,作者引入RoseTTAFoldAA的建模框架,在训练过程中,部分残基可以在原子水平描述,使得模型学习侧链姿态的分布;同时,作者选择部分残基移除对应的序列索引,使得模型在已知残基坐标而未知残基序列位置时建模蛋白质结构。此外,作者还引入了新的流匹配训练方法替代扩散模型以提高训练效率。
为了评估RFdiffusion2,作者发展了一个新的基准测试集。作者构建了一个包含41个活性位点的AME数据集,涵盖了五大类不同的EC编号。作者借助残基岛(residue island,每个岛内的活性残基编号是连续的;不同岛内的残基不能合并成一个具有连续编号的岛)的个数来衡量设计的难度。在最终的表现中,RFdiffusion2能够针对所有活性位点成功生成对应的骨架;而RFdiffusion只能完成其中的16个位点。并且,RFdiffusion不能处理残基岛的数量较多的情形,而RFdiffusion2仍保持了一定的成功率。

最后,作者通过体外实验以证明模型可以从理论酶生成功能酶。在五个例子中,不论理论酶的结构是从酶结构中提取而来还是通过DFT优化计算而来,使用RFdiffusion2均能够在测试小于96个设计蛋白中发现功能酶。

总而言之,本文作者发展了RFdiffusion2,它能够在原子级层面上描述活性位点,从而提升了模型在酶设计问题上的表现。
本文作者:ZF
责任编辑:MB
DOI:10.1038/s41592-025-02975-x
原文链接:https://doi.org/10.1038/s41592-025-02975-x

目前评论:0