结构生物化学/分子建模/分子动力学
经典分子动力学 (MD) 是计算化学的一个分支,它专注于根据牛顿运动定律模拟粒子的运动。[1] 原子被近似为“弹簧上的球”,这使得可以应用以下定律
其中 是位置, 是速度, 是加速度,以及 是时间。
经典 MD 近似将键和角势视为谐波,并将二面角视为周期性的。这使得可以用类似于 AMBER 分子动力学程序使用的以下方程来表达系统的能量:[2]
模拟在一系列“时间步长”中进行。在每一步中,根据能量方程的导数计算每个原子的作用力。原子会移动一定的距离,这个距离与作用力的方向和大小以及时间步长的大小成正比。这个过程会重复很多时间步长,迭代地计算作用力和求解运动方程(基于作用力产生的加速度),并生成模拟复杂行为的结果,从药物化合物的对接到简单蛋白质的折叠。
限制
[edit | edit source]量子效应
[edit | edit source]尽管已知原子是根据薛定谔方程而不是牛顿定律来运作的,但经典方法仍能用较高的精度进行模拟。可以通过检查参与粒子的德布罗意波长来了解这一点[3]
其中 是原子质量, 是温度。当 粒子之间的平均最近邻间距时,经典近似是合理的。因此,对于较重的系统,如有机分子,经典近似是合理的,但对于轻型系统,如 H2、He 或 Ne,该方法的精度会大大降低。
由于原子被近似为离散粒子,因此无法用经典 MD 正确模拟较小粒子的相互作用。[4] 化学键的形成和断裂、非共价反应中间体以及质子或电子隧穿都无法用这种方法模拟。在非常低的温度下进行的模拟也存在问题,因为在接近绝对零度时,经典力学越来越不受青睐,而量子解释则越来越受青睐。量子分子动力学方法可以用于模拟,这些模拟可以更电子地逼真,但计算成本要高得多。
系统大小和时间尺度
[edit | edit source]可以模拟的原子数量和时间量与可用的计算能力直接相关。虽然之前已经模拟过一个小型病毒的全部结构[5],但大多数精细的、全原子模拟都是针对蛋白质的规模,而不是细胞器或复杂的组装体。这是因为观察结果所需的模拟时间与系统大小直接相关。
表格 - 分子过程的时间尺度
[edit | edit source]秒 | 名称 | 过程 |
---|---|---|
10−1 | 表面重组 | |
10−3 | 毫秒 | 蛋白质折叠 |
10−8 | 10 纳秒 | 核磁共振 |
10−9 | 至 10+3 | 布朗动力学 |
10−9 | 至 100 | 格点蒙特卡罗 |
10−12 | 皮秒 | 快速振动 |
10−15 | 飞秒 | 电子激发 |
因此,系统越大,模拟运行的时间就需要越长才能观察到相关的行为。如今,专门为分子动力学模拟设计的计算机硬件[6] 可以用一天的时间模拟大约 17 微秒的 23,000 原子系统,时间步长为 0.5 飞秒。在同一系统上,通用并行超级计算机可以获得大约几百纳秒的模拟时间。
恒温器
[edit | edit source]使用基于牛顿运动方程的方法,在“微正则系综”中获得了模拟,这是一个恒定能量系统 (nVE)。然而,这并不现实,为了与实验结果进行准确比较,模拟最常在正则系综中进行,该系综具有恒定温度 (nVT)。[7]这个温度必须用算法来维持,这种算法被称为恒温器。常用的恒温器有很多,它们在可靠性、精度和计算成本方面各有优劣。
典型的模拟包括一个 MD 平衡阶段,在这个阶段,结构在 0K 恒定温度下模拟一定时间,一个加热阶段,在这个阶段,系统逐渐加热到所需的温度(通常为 300K),以及一个在该恒定温度下的最终生产模拟。最初的平衡不是为了使结构达到化学平衡,而是为了达到能量最小值(通常接近化学平衡状态)。如果省略平衡阶段,而在高能量区域运行模拟,模拟将继续对高能量相空间进行采样,从而产生与实验数据不一致的结果。[8]
这个恒温器遵循朗之万运动方程而不是牛顿运动方程,其中一个与速度成正比的摩擦力被添加到保守力中,它会调整粒子的动能,从而使温度正确。[9]
然后系统由以下方程描述:
其中 、 和 分别是粒子的质量、速度和加速度。 是摩擦常数,而 是一个随机力,它会向粒子添加动能。它是从高斯分布中采样的,其中方差是设定温度和时间步长的函数。这平衡了摩擦力,以使温度保持在设定值。
这个恒温器将系统耦合到一个设定为所需温度的热浴。热浴由随机选择的系统粒子上的随机粒子碰撞来表示。
据已证实[10],将随机碰撞添加到牛顿 MD 系统会使模拟成为一个不可约且非周期的马尔可夫链。这意味着使用安德森算法生成的分布不是正则分布。
这个恒温器会随机影响粒子的速度,这会导致模拟系统中出现非物理动力学。
这个恒温器将系统与设定为所需温度的热浴紧密耦合。这里,每个粒子的动量变化表示为:[11]
这种重新缩放会很快破坏动态相关性,因此不会保持正则系综。
这个恒温器首先于 1984 年提出[12],它涉及以控制温度的方式重新缩放每个粒子的速度。
与高斯恒温器类似,系统与一个设定为所需温度的热浴耦合,尽管这种算法使用的是弱耦合而不是强耦合,其中系统温度的校正使得温度偏差以某个时间常数 指数衰减,该时间常数与时间步长成正比。
该热浴在牛顿运动方程中添加了一个额外的项,,产生了以下二阶微分
其中 是质量, 是目标温度, 是玻尔兹曼常数。热浴被赋予了一定的质量,,对于 Nose 建议的 值,产生了上述每个粒子的动量变化方程。
使用该热浴,模拟系统的能量会发生波动,但系统和热浴的总能量是守恒的。如果系统是遍历的(所有可访问的微观状态的可能性相等),那么该系统将给出正则系综。[13]
分子动力学模拟需要一个“力场”,它列出了能量方程中每种相互作用类型涉及的参数。例如,AMBER 力场需要每个可能的两种原子类型的组合的键平衡长度、键力常数,每个可能的三个原子类型的组合的角度平衡值和角度力,每个可能的四种原子类型的组合的二面角平衡相位、二面角力常数和二面角周期性。额外的参数还描述了每个原子的非键合(静电)力。
这些参数的开发和分析,统称为力场,是分子动力学研究的重点。
经典分子动力学的参数理想情况下会导致行为与原子水平上实际分子的行为非常接近,而实际分子在现实中受量子现象控制。经典参数的开发使得这种情况成为可能——一旦能量和力方程(例如 AMBER 方程)被用来建立系统的范式,参数就会被推导出来,使得使用它们计算的值与使用量子力学方法或实验计算的值相匹配。由于缺乏用于开发力场所需的各种分子和分子构象的实验数据,因此使用量子计算得出的数据来代替。
力场是为特定类型的分子开发的。例如,AMBER 为蛋白质提供了 Amber ff99SB 力场[14],为碳水化合物提供了 Glycam 力场[15],以及新开发的脂质力场 GAFFLipid[16]。此外,还开发了“通用 AMBER 力场”或 GAFF,用于对不适合广泛力场类别的小配体和其他分子进行参数化。
力场的准确性对于模拟的准确性至关重要。诸如二面角力常数之类的简单项,可以对整体模拟产生极大的影响。事实上,蛋白质主链 和 角的不准确二面角参数会导致模拟过度倾向于α螺旋形成,这一事实影响了许多结果。[17][18][19]
从历史上看,力场开发一直受到缺乏可用于拟合的能量和力数据的困扰。力场参数是通过拟合参数来生成的,使得使用这些参数预测的结构的能量或每个原子的力与从头算量子计算生成的能量或力匹配。这些计算非常昂贵,因此通常从一组参数推断到一个通用参数,以避免重复进行计算。例如,使用为四丙氨酸蛋白质主链生成的参数来描述任何蛋白质的主链。
计算能力的不断提高、更有效的算法以及对过去方法的了解为未来的参数开发带来了希望。例如,可以分别计算各种氨基酸的侧链参数,然后将它们添加到一个通用参数集中,以便分别描述每个氨基酸。[20]
经典力场是通过拟合经典参数而开发的,这些参数使其产生的结果与实验和量子数据一致。它们按生物分子类型进行分类——蛋白质、碳水化合物和脂类力场已针对所有主要的 MD 程序单独开发。然而,这种分类仍然相当广泛,并且可能忽略系统特定的相互作用。
- ↑ Meller,Jarosaw。“分子动力学”生命科学百科全书,2001
- ↑ R. Salomon-Ferrer、D.A. Case、R.C.Walker。Amber 生物分子模拟软件包概述。WIREs Comput. Mol. Sci.(2012)
- ↑ J. P. Hansen 和 I. R. McDonald,简单液体理论,第 2 版,学术出版社,1986。
- ↑ Ercolessi,Furio。“分子动力学入门”乌迪内大学计算物理春季学院,1997
- ↑ Peter L. Freddolino、Anton S. Arkhipov、Steven B. Larson、Alexander McPherson 和 Klaus Schulten。完整卫星烟草花叶病毒的分子动力学模拟。结构,14:437-449,2006。
- ↑ David E. Shaw、Martin M. Deneroff、Ron O. Dror、Jeffrey S. Kuskin、Richard H. Larson、John K. Salmon、Cliff Young、Brannon Batson、Kevin J. Bowers、Jack C. Chao、Michael P. Eastwood、Joseph Gagliardo、J.P. Grossman、C. Richard Ho、Douglas J. Ierardi、István Kolossváry、John L. Klepeis、Timothy Layman、Christine McLeavey、Mark A. Moraes、Rolf Mueller、Edward C. Priest、Yibing Shan、Jochen Spengler、Michael Theobald、Brian Towles 和 Stanley C. Wang(2008 年 7 月)。“Anton,用于分子动力学模拟的专用机器”。ACM 通信 (ACM) 51 (7): 91–97。
- ↑ Hunenberger,Phillipe。分子动力学模拟的恒温器算法 DOI:10.1007/b99427
- ↑ Finnerty,J。“分子动力学与物理世界的交汇:恒温器和恒压器”
- ↑ Adelman,S.A. 和 J.D. Doll,原子-固体-表面散射的广义朗之万方程方法 - 经典散射非谐固体的通用公式。化学物理杂志,1976。
- ↑ E,W. 和 Li,D.(2008),分子动力学中的 Andersen 恒温器。纯应用数学通信,61:96–136。doi:10.1002/cpa.20198
- ↑ J. Clarke D. Brown。分子物理学,51:1243,1983。
- ↑ Berendsen,H.J.C. 等人,耦合到外部浴的分子动力学。化学物理杂志,1984。81(8):p. 3684-3690。
- ↑ Palmer,R. G.(1982)。高级物理学 31:669
- ↑ Lindorff‐Larsen,Kresten 等人。“改进 Amber ff99SB 蛋白质力场的侧链扭转势。”蛋白质:结构、功能和生物信息学 78.8 (2010):1950-1958。
- ↑ Kirschner,Karl N. 等人。“GLYCAM06:一种通用的生物分子力场。碳水化合物。”计算化学杂志 29.4 (2007):622-655。
- ↑ Dickson,C. J.、Rosso,L.、Betz,R. M.、Walker,R. C. 和 Gould,I. R.(2012)。GAFFlipid:一种用于准确模拟磷脂的分子动力学的通用 Amber 力场。软物质。
- ↑ Best,Robert B.、Nicolae-Viorel Buchete 和 Gerhard Hummer。“当前的分子动力学力场是否过螺旋?”。生物物理学杂志 95.1 (2008):L07-L09。
- ↑ Freddolino,Peter L. 等人。“蛋白质折叠模拟中的力场偏差。”。生物物理学杂志 96.9 (2009):3772。
- ↑ Lindorff‐Larsen,Kresten 等人。“改进 Amber ff99SB 蛋白质力场的侧链扭转势。”蛋白质:结构、功能和生物信息学 78.8 (2010):1950-1958。
- ↑ Lindorff‐Larsen,Kresten 等人。“改进 Amber ff99SB 蛋白质力场的侧链扭转势。”蛋白质:结构、功能和生物信息学 78.8 (2010):1950-1958。