zl程序教程

您现在的位置是:首页 >  Java

当前栏目

[bioRxiv | 论文简读]

2023-02-18 16:47:51 时间

简读分享 | 赵晏浠 编辑 | 龙文韬

论文题目

OpenFold: Retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization

论文摘要

AlphaFold2 彻底改变了结构生物学,能够以极高的准确性预测蛋白质结构。然而,它的实现缺乏训练新模型所需的代码和数据。这些对于 (i) 解决新任务(如蛋白质-配体复杂结构预测)是必要的,(ii) 研究模型学习的过程,这一过程仍然知之甚少,以及 (iii) 评估模型对看不见的折叠区域的泛化能力 空间。在这里,作者报告了 OpenFold(一种快速、内存高效且可训练的 AlphaFold2 实现)和 OpenProteinSet(最大的蛋白质多序列比对公共数据库)。作者使用 OpenProteinSet 从头开始训练 OpenFold,完全匹配 AlphaFold2 的精度。建立奇偶校验后,作者通过使用精心设计的数据集对其进行再训练来评估 OpenFold 跨折叠空间进行泛化的能力。作者发现 OpenFold 在泛化方面非常稳健,尽管训练集的大小和多样性极度减少,包括二级结构元素类的近乎完全省略。通过分析 OpenFold 在训练过程中产生的中间结构,作者还对模型学习折叠蛋白质的方式有了惊人的了解,发现空间维度是按顺序学习的。总而言之,本文的研究证明了 OpenFold 的强大功能和实用性,作者相信这将被证明是蛋白质建模社区的重要新资源。

论文链接

https://doi.org/10.1101/2022.11.20.517210