结构生物化学/遗传密码
遗传密码是 DNA 碱基序列与蛋白质中氨基酸序列之间的关系。遗传密码的特点包括
- 氨基酸由三个核苷酸编码
- 它是非重叠的
- 它没有标点符号(或者,终止密码子可以被视为“句号”或“句点”。)
- 它被称为简并的或冗余的。
有 20 种氨基酸,但有 4 种碱基,因此至少需要三个碱基才能编码至少 20 种氨基酸。编码氨基酸的三种含氮碱基被称为密码子。总共有 64 个密码子,其中 61 个编码氨基酸,3 个编码链终止。密码子的第一个字母编码特定类别的氨基酸(例如芳香环等)。因此,第一个字母的错误会对生物体造成最严重的破坏,因为它可能会编码完全不同的氨基酸类别。
遗传密码是非重叠的;例如,在 ABCDEF 序列中,ABC 将编码第一个氨基酸,DEF 将编码第二个氨基酸,而在重叠密码中,ABC 可以编码第一个氨基酸,BCD 可以编码第二个氨基酸。遗传密码没有内部标点符号(如逗号和分号),例如在每个密码子之间有 X,如 XABCXDEFX...,因为它从起点顺序读取(但是可以争论说,所谓的“终止”密码子在翻译过程中充当“句号”。)。因此,非三的倍数的缺失或插入突变会导致移码突变。密码子的阅读框架在突变后发生偏移,并且通常会导致之后不久出现终止密码子。由于影响极大,移码突变通常是有害的。
遗传密码是简并的,因为大多数氨基酸都由不止一个密码子编码,除了色氨酸和蛋氨酸,它们只有一个密码子。指定相同氨基酸的密码子被称为**同义词**,这些密码子通常在三联体的最后一个碱基上有所不同。简并性很重要,因为它有助于减少突变的有害影响,因为点突变(仅在单个氨基酸上不同)通常不会显着改变蛋白质(如果有的话)。当然,所有遗传信息并不仅仅依赖于遗传密码,它也来自调控序列、基因间片段和染色体结构区域,这些区域不像这个遗传密码表那么简单。另一个与遗传密码简并性同义的术语是冗余。
翻译是从 mRNA 模板合成蛋白质的过程。这个过程涉及几个关键分子,包括 mRNA、核糖体的小亚基和大亚基、tRNA 和释放因子。该过程分为三个阶段:起始、延伸和终止。真核 mRNA 是翻译的底物,具有独特的 3' 端,称为 Poly-A 尾。信使 RNA (mRNA) 还包含编码特定氨基酸的密码子;5' 端有一个甲基化的帽子。翻译起始从核糖体小亚基附着到帽子并移动到翻译起始位点开始。转移 RNA (tRNA) 是另一个关键分子。它包含一个反密码子,与它结合的 mRNA 密码子互补。第一个 mRNA 密码子通常是 AUG。与 tRNA 末端连接的是相应的氨基酸;蛋氨酸对应于 AUG 密码子。现在,核糖体的大亚基结合形成肽酰基或 (P) 位点和氨酰基或 (A) 位点。第一个 tRNA 占据 P 位点,而第二个 tRNA 进入 (A) 位点,并且与第二个 mRNA 密码子互补。然后将蛋氨酸转移到 (A) 位点的氨基酸,第一个 tRNA 退出,核糖体沿 mRNA 移动,下一个 tRNA 进入。这些是延伸的基本步骤。随着延伸的继续,不断增长的肽不断转移到 (A) 位点的 tRNA,核糖体沿着 mRNA 移动,新的 tRNA 进入。当 (A) 位点遇到终止密码子时,释放因子进入 (A) 位点,翻译终止。当终止达到时,核糖体分离,新形成的蛋白质被释放。
U | C | A | G | ||
---|---|---|---|---|---|
U | |||||
Phe | Ser | Tyr | Cys | U | |
Phe | Ser | Tyr | Cys | C | |
Leu | Ser | Stop | Stop | A | |
Leu | Ser | Stop | Trp | G | |
C | |||||
Leu | Pro | His | Arg | U | |
Leu | Pro | His | Arg | C | |
Leu | Pro | Gln | Arg | A | |
Leu | Pro | Gln | Arg | G | |
A | |||||
Ile | Thr | Asn | Ser | U | |
Ile | Thr | Asn | Ser | C | |
Ile | Thr | Lys | Arg | A | |
Met | Thr | Lys | Arg | G | |
G | |||||
Val | Ala | Asp | Gly | U | |
Val | Ala | Asp | Gly | C | |
Val | Ala | Glu | Gly | A | |
Val | Ala | Glu | Gly | G |
遗传密码在所有物种中都是通用的吗?由于许多野生型和突变基因的遗传碱基序列是已知的,因此可以通过遗传密码正确预测基因中的核苷酸和氨基酸变化。mRNA 可以被许多不同物种的蛋白质合成方法正确翻译。例如,小麦胚芽提取物可以正确翻译人类血红蛋白 mRNA,人类细菌可以表达编码人类蛋白质(如胰岛素)的重组 DNA 分子。尽管这些发现表明遗传密码在物种之间是通用的,但在人类线粒体 DNA 成为已知时,事实并非如此。人类线粒体 DNA 在遗传密码的翻译中有所不同,它将 UGA 翻译为色氨酸,而不是终止信号。此外,AGA 和 AGG 被解读为终止信号,而不是精氨酸,而 AUA 编码蛋氨酸,而不是异亮氨酸。还发现其他物种的线粒体 DNA 也具有略有不同的遗传密码。线粒体 DNA 可以与细胞中其他 DNA 不同,因为它编码一组独特的 tRNA。此外,一些细胞蛋白质合成系统(至少 16 个)偏离了标准遗传密码,例如纤毛原生动物,它将 UAA 和 UAG 解读为氨基酸的密码子,而不是终止信号。UGA 用作它们的唯一终止信号。遗传密码的细微变化存在于线粒体和在真核生物进化早期分支的物种中。遗传密码的大多数变异都是为了更简单的密码,并减少三联体第三个碱基的信息,例如 AUA 和 AUG 都是蛋氨酸的密码子。因此,遗传密码几乎是通用的,但并不完全通用。
遗传密码在进化过程中的不变性可能是由于对有害突变的选择造成的,这些有害突变会导致如果改变 mRNA 阅读的突变改变了生物体产生的蛋白质的氨基酸序列。
1. Berg, Jeremy M. 2007. 生物化学。第六版。纽约:W.H. Freeman。125-127