1.本研究提出了蛋白质折叠进化模拟器(PFES),这是一个从随机氨基酸序列开始,以原子分辨率模拟蛋白质进化的计算框架。
2.作者利用PFES证明,稳定的球状蛋白质折叠可以相对容易地从随机序列进化而来,每个位点只需0.2到3个突变,与LUCA以来观察到的进化变化相当或更少。
3.值得注意的是,大约一半进化出的蛋白质与已知的自然折叠(例如HTH、SH3和β三明治)相似,而其余的则是独一无二的,这凸显了该模拟器探索蛋白质折叠空间新区域的能力。
4.PFES模拟表明,简单的α螺旋结构出现最频繁,通常是通过渐进式突变或重复实现的;富含β的折叠则通过β发夹结构的重复进化成更复杂的β折叠和桶状结构。
5. 多种独立的结构预测和验证方法(ESMfold、AlphaFold3、ProteinMPNN 和 MD 模拟)证实了进化蛋白质的稳定性和结构合理性,即使那些具有新折叠的蛋白质也是如此。
6. 进化的蛋白质通常在模拟的早期达到稳定,之后折叠基本固定,而序列继续漂移——模拟适应度景观中的自然进化平台期。
7. 作者表明,从随机肽到稳定折叠的进化轨迹不仅易于处理,而且可重复:在 200 次模拟中,110 次产生了独特的折叠,而其他折叠则收敛于共同的基序。
8. 通过在蛋白质-蛋白质相互作用的背景下模拟进化,PFES 可以生成界面适应结构,包括通过疏水接触结合 Cas9 的 HNH 结构域的抗 CRISPR 模拟物。
9. 使用 Foldseek 进行结构搜索,将 200 个模拟蛋白质中的 82 个与已知折叠匹配,包括与实验确定的 PDB 条目匹配——尽管这些蛋白质来自人工来源,但仍证明了其生物学相关性。
10. PFES 提供完整的进化历史,能够详细重建每个突变及其相应的结构变化,为研究折叠成核、漂移和结构创新提供了丰富的数据集。
11. 这项研究支持了这样一种观点:折叠稳定性和相互作用能力的选择,而非特定功能,可能是驱动折叠蛋白质从 RNA-肽世界中出现的原因。
12. 这项研究表明,“蛋白质大爆炸”——早期进化过程中结构多样性的快速扩展——可能是由基本的生物物理原理和最小的选择压力促成的。
13. PFES 利用现代结构预测工具(如 ESMfold)克服了先前建模的局限性,为以全原子分辨率观察早期蛋白质进化提供了一个前所未有的窗口。
14.局限性包括结构预测器的当前精度界限,特别是对于低置信度的中间状态,但作者认为这些可能代表早期进化中现实的折叠平衡。
15.总体而言,PFES 揭示球状蛋白质折叠具有从随机序列高度进化的能力,并表明稳定折叠的出现可能在早期进化中快速而直接。