结构生物化学/稳定性、突变和可进化性

近年来，科学家们普遍认为蛋白质能够耐受大多数氨基酸替换，但这一观点已被新的概念所取代，即蛋白质突变的有害影响是限制蛋白质序列和功能变化的主要因素。本文分析了预测突变后稳定性影响的不同方法，以及用于弥补这些破坏稳定性（从而促进蛋白质进化）影响的不同机制。最广泛接受的观点是，蛋白质上的大多数位置能够承受剧烈的序列变化，同时保持蛋白质的构型稳定性和功能。尽管这种观点存在例外，但该假设认为稳定性与活性变化相关。2005 年，发表了两篇论文，标志着突变对蛋白质进化稳定性影响的重要性，随后，人们对这两篇论文进行了进一步研究，发现了蛋白质生物物理学与其分子进化之间的新联系。

蛋白质适应度

由于突变可以被描述为进化的“原材料”，因此为了持续维持现有结构和功能的选择会消除大多数蛋白质突变，从而降低未来适应的可能性。这得出了一个结论，即发生的每个突变中只有一小部分会真正被固定在正向选择下，以采用和维持一种新的功能。中性突变也被称为“中性漂移”，它可以在小型种群中因随机性而被固定。但对于生物体的层级来说，繁殖率（适应度，W）并不简单，它们几乎从不与一种基因或一种蛋白质的特性相关联。由于冗余、备份和稳健性在不同层级上的影响，突变的影响因此被掩盖。基于这些原因，可以得出结论，突变的影响对于进化生物学家来说是一个难题。但是，一个方程可以用来展示蛋白质适应度的简单模型。蛋白质适应度（W）是酶催化反应的波动，而这种波动又与这种特定酶发挥功能的生物体的适应度系统地相关联。因此，这种持续的波动与功能性蛋白质的浓度 $[E_{0}]$ 及其功能 f（以比例表示）相关联。

W=[E_{0}]f

研究表明，功能性蛋白质的浓度 $[E_{0}]$ 与蛋白质稳定性相关。约 ≥80% 的突变的有害影响源于它们对稳定性和折叠的影响。当可溶性功能性蛋白质的水平降低时，就会导致蛋白质功能失常，而蛋白质功能失常则是由超过一定水平的破坏稳定性的突变引起的。通过对不同蛋白质进行实验测量，证据表明突变有害的概率在 33-40% 的范围内（平均为 36%）。因此，很明显，随着突变的积累，蛋白质适应度呈指数下降。这可以通过以下公式表示：

W≈e^(-0.36n)

以下等式表示随着突变的增加，蛋白质适应度相应下降。n 是突变的平均数量。因此，当平均蛋白质积累时（平均约为 5 个突变），适应度将下降至 <20%。因此，蛋白质的初始稳定性可以抵消一些破坏稳定性的突变的影响，可以得出结论，蛋白质进化的速度取决于特定蛋白质的稳定性，因此，蛋白质进化的速度可能与获得新功能有关。

热力学稳定性

(∆G) 在各种模型中被用来描述进化，因为它是对稳定性的定义。因此，热力学稳定性是指蛋白质的展开态和天然态之间的能量差，但这种热力学稳定性测量仅适用于小蛋白质。但是，这种计算并不代表蛋白质在细胞环境中的稳定性。因此，动力学稳定性非常重要，因为它与蛋白质展开态和天然态之间折叠中间体的能量水平相关联，并且可以包括蛋白质的错误折叠形式。此外，这些错误折叠形式可能会导致聚集，如果不能被降解，就会造成问题。实验数据表明，突变对热力学稳定性的变化与仅适用于一小部分蛋白质的变化相关。但最近的研究表明，在计算方面取得了进展，使人们能够预测各种范围的蛋白质中突变的 ∆∆G 值。这些预测可以基于序列或蛋白质的 3D 结构，并且序列和 3D 结构的组合也被结合在一起。这种预测与突变对天然态的影响密切相关，因此不包括天然位点突变的影响。人们已经注意到，体内折叠的影响与热力学稳定性影响高度重叠。因此，对动力学稳定性影响的预测将具有重要价值。因此，对突变影响的更准确预测仍然是一个挑战，因为这些影响与蛋白质水平有关，因为它们存在于体内。

稳定性与蛋白质适应度之间的关系

蛋白质适应度与突变之间的关系由以下等式决定：

W\propto [E_{0}]=1-{\frac {1}{e^{-{\frac {\Delta G}{RT}}}+1}}

这种 S 型关系表明，稳定性因子为 -3kcal/mol 时，超过 99% 的蛋白质会折叠，而许多蛋白质的稳定性因子在几个 k/mol 的范围内。然而，低于 -3kcal/mol 的 ∆G 值会导致平衡偏离蛋白质的折叠功能状态。使用上述公式，稳定性因子小于 -3kcal/mol 表明一定量的蛋白质会发生错误折叠或部分折叠，这会导致聚集和降解的不可逆影响。

阈值模型

上述方程式还表明了一种关系，即蛋白质在导致其适应性下降之前，可以承受一定数量的突变。[E₀]（或蛋白质适应性，因为它们彼此成正比）只要 ΔG 仍然高于某个阈值，称为 ΔG_t，如图所示“阈值鲁棒性模型”，就会保持固定。如果阈值要增加（绿色阈值鲁棒性线），则对突变的耐受性会更高。然而，一旦突变开始积累，蛋白质适应性就会迅速下降。许多导致单基因疾病的突变表现出 S 型关系。

上位性效应

阈值模型体现了负上位性（当存在其他突变时，突变的有害影响会增加）。正如预期的那样，前几个突变对蛋白质适应性没有或几乎没有影响，因为过量的稳定性缓冲了这些不稳定的突变。然而，更多突变的积累是累加的，会导致稳定性下降，最终导致适应性下降。负上位性效应表明，由于对蛋白质适应性没有直接影响，因此自然选择不利于较高的 ΔG 值。

环境鲁棒性和表型突变

遗传鲁棒性可以用阈值模型来解释，其中蛋白质在阈值（ΔG_t）增加时，对突变的耐受性更高。环境鲁棒性是一个理论，解释了为什么蛋白质中会出现遗传鲁棒性。温度、盐度和其他环境因素的波动可能会影响更高稳定性的进化。另一个因素可能是表型突变。因为这些类型的突变比遗传突变更频繁地发生，所以表型突变被认为会对蛋白质适应性产生直接影响。因此，人们认为更高稳定性阈值的进化是为了缓冲表型突变和其他环境因素的影响。

梯度鲁棒性

另一种对突变的鲁棒性，梯度鲁棒性，与较小的初始稳定性裕度相关，但斜率较小，因此每个突变平均会导致较低的稳定性损失。在一个没有紧密堆积的蛋白质中，预计稳定性变化会更小，因为已经很少有残基接触，因此没有太多相互作用可以丢失。事实上，来自 RNA 病毒的蛋白质表现出这种类型的关系。这些病毒的突变率比大多数其他生物高几个数量级。它们的蛋白质整体稳定性较低，并且经常松散堆积或部分无序。梯度鲁棒性是指具有强大、紧密堆积结构的蛋白质比残基接触较少的蛋白质表现出更高的稳定性损失。

新功能和稳定性

适应性新功能突变通常发生在更埋藏的残基中，比非适应性、中性突变更不稳定。如果这些类型的突变积累，蛋白质稳定性将低于 ∆Gt，从而降低 [e]o，最终降低蛋白质适应性。蛋白质获得赋予新功能的突变的能力受到此类突变的不稳定效应的限制。观察表明，改善了 TEM-1-乳糖酶对第三代抗生素的催化效率的突变是不稳定的，这表明蛋白质稳定性和新功能的进化之间存在权衡。另一方面，在功能发生变化后，经常会看到恢复蛋白质稳定性的补偿性突变。FoldX 对新功能突变的预测表明，虽然新功能突变是不稳定的，但它们并不比平均突变更不稳定。观察结果与这种预测相矛盾；发现新功能突变比中性突变更不稳定，并且通常更多地发生在内部残基中。如果新功能突变积累，蛋白质稳定性可能会下降，导致蛋白质适应性下降，即使突变改善了功能。P450 和 TEM1 的稳定变体表现出更高的可进化性，因为它们能够容纳更多的新功能突变，而不会相应地降低酶水平。

稳定性和进化变化：上坡分化、下坡分化和伴侣蛋白

不同类型突变的蛋白质稳定性变化的进化变化的图形表示。
绿色区域代表蛋白质稳定性，红色区域代表不稳定性。蓝色箭头代表稳定性突变，橙色箭头代表新功能突变（或不稳定性突变）。图 B 中用黄色方框标记的区域代表伴侣蛋白缓冲。

上坡分化

补偿性突变（或全局抑制因子）恢复了进化蛋白质的稳定性裕度。补偿性突变也被称为全局抑制因子，因为它们可以抑制各种突变的有害影响，并且在蛋白质的进化动力学中发挥着重要作用（在自然进化和体外进化中都观察到）。大多数补偿性突变是稳定的，例如，在对抗生素头孢噻肟耐药性的发展中，TEM-1 显示出活性位点突变，这些突变提供了新的耐药性，随后是稳定性补偿性突变 Met182Thr。进化速度受补偿性突变恢复进化蛋白质的稳定性所需时间的限制。尽管如此，改变蛋白质功能并且比 ∆Gt 更不稳定的突变无法固定，除非受到伴侣蛋白的缓冲。

稳定性祖先/共识突变和下坡分化

通过将补偿性突变（稳定性因子）与新功能突变（不稳定性因子）配对，蛋白质的整体稳定性得以维持。然而，过量的稳定性可能会阻碍可进化性，因为蛋白质变得僵硬，限制了可能解释新功能的替代构象。在蛋白质工程中使用下坡分化的一个方法是将补偿性突变纳入用于选择酶新功能的库中；但是，这将需要能够预测稳定性补偿性突变。在一个中性漂移实验（多轮突变和纯化以保持酶的功能），该实验为预测稳定性补偿性突变提供了提示，几种不同的突变得到了富集，其中五种显示最高富集的突变提高了稳定性，并充当了一系列不稳定性突变的补偿性突变。富集的突变有一个共同点：它们都将 TEM-1 的序列改变得更接近其家族共识，或其祖先。如果突变发生在保守的残基中，它通常会导致稳定性大幅下降，而通过恢复偏离共识氨基酸的残基可以提高稳定性。祖先干扰和/或共识分析可以用来预测补偿性突变。然后，这些预测的补偿性突变可以用来通过下坡分化促进具有新功能的更稳定蛋白质的工程化。

伴侣蛋白和蛋白质可进化性

已知伴侣蛋白可以帮助蛋白质折叠，但它们也可以缓冲突变的影响。虽然对进化速率的程度和影响尚不清楚，但伴侣蛋白似乎扩大了中性区，允许不稳定性突变的积累。最近建立了一种测量细菌伴侣蛋白 GroEL/ES 缓冲能力的方法，其中在 GroEL/ES 蛋白过表达的情况下进行了突变积累实验。然后测试积累突变的蛋白质以确定获得的突变的数量和类型以及稳定性所需的缓冲量。发现，在 GroEL/ES 过表达的情况下，积累的中性突变数量增加了一倍，可变性也增加了。蛋白质核心中的突变水平增加，并且这些突变平均比没有 GroEL/ES 的情况下具有更高的不稳定效应。还表明 GroEL/ES 的过表达可以加速新的酶特异性的获得。在一个案例中观察到，在 GroEL/ES 过表达下选择的酶变体具有一个突变，该突变在很大程度上改善了正在进化的新的活性，但也非常不稳定。没有 GroEL/ES 选择的变体带有另一个突变，该突变显示出较低的改进，没有不稳定性，而没有伴侣蛋白过表达选择出的变体没有显示出改进的功能，甚至由于酶浓度较低而导致功能下降。

已知伴侣蛋白（GroEL）使用 ATP 来帮助蛋白质折叠。该过程包括未折叠的蛋白质与 GroEL 结合，而不会阻断 GroES。然后，ATP 将与 GroEL 七聚体结合，这将导致 ATP 水解。ATP 水解包括释放 14ADP 和 GroES。从这里开始，GroEL 然后与 7ATP 和 GroES 结合在口袋中，这将允许蛋白质在内部折叠。从口袋中释放的蛋白质意味着它们是完全或部分折叠的，而未折叠的蛋白质被送回与 ATP 结合。

参考文献

Tokuriki, Nobuhiko 和 Dan S. Tawfik。 “突变的稳定性效应和蛋白质可进化性”。《结构生物学当前观点》19.5 (2009): 596-604。印刷版。