引言

长时间的分子动力学(MD)模拟在研究蛋白构象变化中非常成功。原则上,MD模拟对于研究RNA分子的构象变化同样应该是一个强大的工具。然而,RNA的物理模型精确性相比蛋白模型精确度较低,甚至在简单的RNA体系中都需要人工矫正来提升RNA力场的精确性,这限制了其应用。提高RNA力场的精确性将极大地促进MD模拟用于研究具有生物意义的RNA分子相关的动力学。

AMBER是现在使用的非常广的RNA体系MD模拟力场。在过去几十年,提升AMBER RNA力场主要关注的是通过量子化学模拟(QM)计算精炼骨架和糖苷转角的参数。这些优化能够提升经典双螺旋RNA结构的精确度,但是仍存在核碱基堆叠过分稳定以及过低估计了基准面的强度的关键问题。这些的决定因素往往是静电(electrostatics)相互作用和范德华力(vdW)相互作用导致的。Chen和García通过调整核酸酶原子的VDW参数来削弱堆积和加强碱基配对来解决这个问题。该方案能够提升RNA tetraloops的结构性质,但是对于其他模型的模拟,例如ssRNAs没有作用。

成果简介

分子动力学(MD)模拟对于全原子水平来描述蛋白经历的构象变化方面是一个非常有用的工具。同样,MD模拟也能够应用于研究RNA结构的变化,但更具挑战性,归因于可用的很大一部分物理模型(“RNA力场”)相比蛋白精确性不够。D. E. Shaw 研究所的D. E. Shaw教授在《Proceedings of the National Academy of Sciences》发表了题为"RNA force field with accuracy comparable to state-of-the-art protein force fields"的文章,作者基于量子力学计算和已有的实验信息,修正了广泛使用的RNA力场版本(AMBER 14ff)的部分参数,使其更加精确的反应RNA结构的稳定性。作者使用长时间的模拟来评估单链RNA,双链RNA,发夹RNA和核酶。在这些模拟中测量到的结构和热力学性质与实验确定的值有很大的一致性。与蛋白力场相比,此RNA力场精确性达到了最先进的蛋白力场水平,这对在阐述RNA分子和包含RNA生物组装的功能模拟中具有非常重要的意义。
图文解读

1.png

图1.(A)展示了力场修饰后的核苷酸原子的vdW原子类型。基于其芳香原子特征,分割成两种不同原子类型的氮原子,并且减少极性氢原子中的 σ 和 e值至0,极大的提升了其与QM数据的拟合曲线(结合表1) (B).表示A-U Watson-Crick配对联系能。可以看到与量子化学模拟(MQ)中的MP2方法相比,AMBER ff14SB低估了碱基配对的强度,特别在2.7Å之前。(C).A-A堆叠二面角在74.6°转角下的联系能,AMBER ff14SB高估了其联系(D) 75.5°转角下的U-U堆叠二面角联系能,同(C)

t1.png

表1. 修饰原子中的碱基电荷变化,同时对三个转角(γ, ζ, 和 χ转角)以及二面角进行了调整,具体请查阅文章的(Figs.S3-S6,Tables S1-S4)

2.png

图2.主要表示的是修饰后的参数能够很好的反映ssRNA四核甘酸在溶液中的构象。(A)MD模拟单链RNA(ssRNA)四核甘酸使用AMBER ff14和TIP3P水模型,在模拟过程中其分子趋于夹层构象,但与实验的3J-标量耦合值具有非常大的差异(见Table S5)说明这种嵌入构象可能是模拟的人工痕迹(artifact)(B为修饰后的模型)。左侧的散点图表示骨架非氢原子到初始的A-form 结构的rmsds值。右侧表示为四个核苷酸的叠加模式,将模拟的构象划分为六个组。主要的A-form(AMa,绿色),较少的A-form(AMi ,蓝色),夹层(I,红色)核苷酸4翻转(F4,黄色),核苷酸1翻转(F1,品红色)和其他(O,黑色),右侧图形为这六个组的百分比表示。在修饰后的模拟过程和实验NMR值的3J-标量耦合值之间的χ2误差降低到1.4-2.2之间,其表现与大多的蛋白力场性能相当。值得注意的是UUUU的误差较大(χ2 ≈ 4),(无序构象相对于实验较少),可能是因为UUUU在不可忽略的模拟帧中访问了堆叠状态。

3.png

图3.(A)利用AMBER ff14和TIP3P长距离ssRNA模拟rU40的两端距离随时间的变化(B)修饰后的参数和TIP4P-D水模型,条件为0.05M NaCl 300K模拟结果.(C)rU40的<RFRET>值位于不同的NaCl浓度.可以发现AMBER ff14力场模拟的端对端距离迅速降低,成为一个类球型的的结构,这个值小于单分子FRET实验的数值。使用TIP4P-D模型得到同样的结果。在TIP4P-D水模型中使用作者修饰的参数模型可以发现在低盐浓度下与实验值较为吻合(小于0.1M),在高盐浓度下,18U-U碱基对在扩展和双螺旋发夹构象之间交替导致更低的<RFRET>值的产生。修饰的力场可能更好的重复出ssRNA的无序性,但是可能导致双螺旋构象更加稳定。

4.png

图4.MD模拟RNA双链(A).CACAG不包括氢的rmsd轨迹。可以明显的看出折叠(绿色)与解折叠(红色)之间的变化(B).CACAG序列随时间变化的温度模拟 (C).CACAG的溶解(Melting)曲线(D).8个RNA双链的Ttm值,结果提取自对应MD轨迹,黑色的为NN模型(实验驱动的最邻近模拟)验证的Ttm值,模拟的Ttm值与实验值相比约高5-50K (E)通过MD轨迹的ΔG310K计算(通过拟合非线性van't Hoff公式),比较验证NN模型。在退货模拟中,GAGUGAG和CGACGCAG的最低温度高于310 K,因此,对于这些双链体,ΔG310K值是根据拟合的InKeq-1/T curve曲线推算。和NN模型相比有轻微的误差(root-mean-square误差:1.4kcal mol-1),这与低估了折叠焓相关,这在蛋白质折叠中同样存在。

5.png

图5.不包括氢的rmsd轨迹,ggcacUUCGgugcc(A),gccGAAAggc(B)和ggcGCAAgcc (C)RNA tetraloops温度随时间的演变和melting曲线,绿色,蓝色和红色分别表示tetraloops的自然态,中间态和解折叠态。误差棒使用阻塞分析。可以看出四个碱基的模拟记录了可逆的事件,即从折叠到解折叠可逆的过程,同时可以发现从解折叠到折叠事件中可以达到<1Å的rmsd值。

6.png

图6.展示了核糖开关的模拟(A). 结合配体状态的鸟嘌呤核糖开关aptamer(结构如图S13)的结合口袋不包括氢的rmsd轨迹.绿色,橘色和红色分别表示自然结合状态,非自然结合状态以及未结合构象。(B). 模拟过程中结合态(绿色)与非结合态(红色)C1‘原子的均方根波动(RMSF),计算时,螺旋区的C1’原子对齐。结果与实验的N-甲基乙酸酐检测的结果基本一致,但J1/2片段相对于实验结果柔性相对较低。(C和D)SAM-I aptamer 分别为与Mg离子(C). 或仅与K离子(D). 模拟非氢原子对距离图谱(上图)和非氢RMSD对晶体结构的分布(PDB ID 3IQR)图谱(下图)(E和F)理论SAXS图,展示为散点图(上图)和Kratky图(下图),模拟Mg-C,K-C和K-E在无配体(apo E)和结合配体(F)态SAM-I aptmer存在K离子情况下的整体与实验的SAXS图之间的比较,可以看到修饰后的参数能够很好的说明解释实验的结果。

7.png

图S13.(A)鸟嘌呤核糖开关aptamer结构域(PDB ID 4FE5) (B)晶体结构中观察到的自然结合态,氢键用红色虚线表示 (C).模拟中观察到的非自然态结合姿势。

总结与展望

作者重新参数化了AMBER RNA力场用于拟合碱基堆叠和碱基对联系,同时作者重新修饰了核酸原子的电荷和vdW参数,以及χ, γ, 和 ζ 转角电势。使得其更好的平衡电荷联系和分散联系。这组修饰后的参数在多个RNA系统中均有让人非常满意的结果。模拟能够精确的重现长和短单链寡聚核苷酸的构象变化,tetraloops和双链RNA的结构(rmsd)和稳定性(1.5kcal*mol-1内),RNA折叠的动态构象和小分子配体的结合姿势。其准确度达到了蛋白力场的精确水平.
最后作者同时指出了该参数仍然存在一些缺陷,第一点就是使得RNAs螺旋结构过于稳定,导致了rU40,RNA双链和tetraloops更高的溶解温度,这种过的稳定导致UUUU四核苷酸和鸟嘌呤核苷酸开关aptamer结构域的J1/2片段变得更加有序。同时并未调查非键参数的精确性,例如一些特殊带电离子和磷酸根等等.(译者认为其使用了TIP3P以及TIP4P-D水模型,而没有使用如今在DNA与RNA中普遍使用的OPC水模型,可能导致拟合的力场参数与OPC水模型之间模拟失真,需要读者自行论证。)

文献链接

Tan D, Piana S, Dirks R M, et al. RNA force field with accuracy comparable to state-of-the-art protein force fields[J]. Proceedings of the National Academy of Sciences, (2018). DOI:10.1073/pnas.1713027115

团队简介

1.jpg

David Shaw,犹太裔美国人,出生于1951年,本科毕业于加州圣地亚哥分校。1980年在斯坦福大学获得博士学位。他从斯坦福毕业后到哥伦比亚大学计算机系任教,用Non-Von 超级电脑进行超大规模并行计算的科研。
1986年离开哥伦比亚大学进入Morgan工作。1988年,在Morgan仅仅工作一年半后,他募集了2800万美元,雇佣了六名员工,在纽约艺术家聚集的格林威治村开办了自己的对冲基金 。D. E. Shaw Group目前拥有360亿美元资产,他的对冲基金全世界排名前20。David Shaw也被福布斯杂志称为量化投资之王(King Quant),个人资产41亿美元,大概在全球财富排行榜300名。

1.jpeg

2001年,他成立了D. E. Shaw 研究所, 一个私立科研机构,自己担任首席科学家全职做科研。不用再担心经费的问题,他雇佣了生物、化学、计算机硬件、软件等多个领域的人才,开发了Anton超级计算机。D. E. Shaw Research在蛋白质折叠和分子动力学方面的成果发表在Nature, Science,Cell等各种顶级学术期刊上,成为这些领域的标杆性成就。 David Shaw本人2007年入选美国艺术和科学国家研究院,2009年成为奥巴马政府科学工程委员会委员,在2012年和2014年成为美国国家工程院院士和美国国家科学院院士。
--团队介绍摘抄自公众号:普林斯顿实验室
作者主页:
http://www.deshawresearch.com

标签: none