结构生物化学/利用祖先基因重建分析蛋白质结构和功能
了解蛋白质序列如何决定结构和功能,以及了解产生现存蛋白质的多种结构和功能的过程,需要了解蛋白质序列可能空间中结构和功能的分布情况。然而,由于可能的序列数量巨大,以及实验生成和研究它们所需的时间,因此表征这种分布可能非常困难。解决此问题的一个方法是分析进化记录。进化是一个巨大的实验,涉及蛋白质结构的多样化和优化。这个巨大实验的结果保存在现代蛋白质家族的序列、结构和功能中。对这些家族的进化分析可以为蛋白质序列空间的性质以及蛋白质结构和功能的决定因素提供关键见解。
研究蛋白质家族的一种方法是使用基于序列或结构的分析来识别不同家族成员之间的候选氨基酸差异。之后可以通过使用定点诱变在家族成员之间交换这些残基来测试它们的功能作用。这被称为“水平”方法,它通过交换残基来识别对一种功能重要的残基,因为交换会使蛋白质失活或无法发挥功能。然而,这种方法很少识别出足以将一种蛋白质的功能转换为另一种蛋白质的功能的残基集。蛋白质功能随着时间的推移而进化,或者垂直地,在祖先蛋白谱系中积累的突变而发生。另一方面,现代蛋白质的水平比较仅涉及进化树的顶端。水平方法有两个主要缺陷。首先,它效率低下,因为在感兴趣的功能没有改变的时间间隔内,可能积累了许多功能无关的序列差异。其次,谱系特异性序列变化可能会导致上位性,或者突变之间的相互依赖性,导致单一变化在不同的蛋白质家族成员中产生不同的影响。
一种明确的系统发育方法来研究蛋白质家族内的功能多样性可以解决这些问题。垂直策略将解决发生在功能多样化发生的家族树分支上的突变。这种策略效率更高,因为只需要调查在有限的进化时间段内发生的突变。此外,这种垂直策略可以通过使用实际发生序列变化的蛋白质背景来避免上位性相互作用的影响。垂直策略甚至会识别限制性和允许性上位性突变。
研究家族分支的进化可能很困难,因为它需要访问分支两端的节点。然而,祖先序列重建 (ASR),一种研究分子进化的新策略,可以解决这个问题。ASR 是一项成熟的技术,已被用于研究许多蛋白质家族,包括 GFP 样蛋白质、类固醇受体、视蛋白等。ASR 首先从现存蛋白质序列的比对中推断出祖先序列。系统发育树上任何祖先节点的最大似然序列是产生现代蛋白质中所有序列数据的概率最高的序列。一旦发现祖先蛋白质序列,就可以合成编码它的 DNA 分子。这允许祖先蛋白质被实验表达和表征。以下案例研究证明了 ASR 研究在定量分析决定功能的相互作用、揭示功能背后的多个氨基酸以及确定上位性在塑造蛋白质进化中的作用方面的有效性。
视蛋白:量化功能相互作用
视蛋白的研究表明了使用 ASR 来研究功能转换突变的影响的好处。视蛋白是 G 蛋白偶联受体家族,它们在脊椎动物视觉系统中吸收光。所有视蛋白都使用相同的共价连接的生色团。然而,每个视蛋白都有不同的最大吸收波长。由于最大吸收波长序列决定因素的复杂性,现代视蛋白的比较研究难以解释。然而,研究人员能够使用 ASR 来解开这些相互作用,并产生了普遍适用于整个家族的结果。
GFP 样蛋白质
Mikhail Matz 的实验室对来自石珊瑚的 GFP 样蛋白质的工作证明了 ASR 在识别这些残基方面的有效使用。通过使用 ASR 来表征整个家族的古代序列,Matz 及其同事发现,祖先的 Faviina 中的 GFP 样蛋白质在绿色中发出荧光,随后是各种其他颜色。Matz 及其同事随后决定确定导致这种绿色祖先在巨大星珊瑚 Montastrea cavernosa 中进化出红色荧光的突变。通过使用 ASR,他们能够识别出使用水平方法无法识别的突变。
这些 ASR 案例研究表明,ASR 有望为塑造蛋白质进化的物理化学决定因素以及蛋白质结构的历史决定因素提供新的见解。此外,ASR 在机械生物化学和进化生物学之间架起了一座桥梁,这两门学科在很大程度上是分开的。
- 结构生物学现状 20 卷,3 期,2010 年 6 月,第 360-366 页