生物化学/蛋白质/简介
蛋白质是生物学的基本分子之一。它们存在于当今地球上的所有生命中,负责大多数使生命成为可能的复杂功能。它们也是生物的主要结构成分。根据分子生物学中心法则(由弗朗西斯·克里克于 1958 年提出),信息从 DNA 传递到 RNA 再到蛋白质。DNA 作为合成蛋白质所需信息的存储介质,RNA 负责(除其他事项外)将此信息翻译成蛋白质分子,作为核糖体的组成部分。
几乎所有活细胞的复杂化学功能都是由称为酶的基于蛋白质的催化剂执行的。具体来说,酶要么形成要么断裂化学键。蛋白质酶不应与基于 RNA 的酶(也称为核酶)混淆,核酶是一组执行与蛋白质酶类似功能的大分子。此外,大多数将细胞和细胞器结合在一起的支架都是由蛋白质制成的。除了它们的催化功能外,蛋白质还可以从细胞外环境传递和传递信号,复制遗传信息,帮助以惊人的效率转换光和化学物质中的能量,将化学能转化为机械功,并在细胞区室之间携带分子。
蛋白质的功能如此之多,以至于重要的是要注意蛋白质不做什么。目前没有已知的蛋白质可以直接复制自身。朊病毒也不例外。据推测,朊病毒可能能够充当其他化学上(但不是结构上)相同的蛋白质的结构模板,但它们不能作为蛋白质从头合成的天然模板发挥作用。在大多数生物体中,蛋白质不会作为基本能量储备,因为它们的代谢比糖或脂类慢且效率低。另一方面,它们是许多生物体基本氮和氨基酸储备。除了病毒之外,蛋白质在大多数生物体中不直接作为膜发挥作用;然而,它们通常是这些结构的重要组成部分,既能提供稳定性又能提供结构支撑。
蛋白质由氨基酸的线性(不分支且不形成环)聚合物组成。二十个遗传编码的氨基酸是共享中心核心的分子:α-碳与伯氨基 (-NH2) 末端、羧酸 (-COOH) 末端、氢原子和氨基酸侧链(也称为“R基团”)相连。R基团决定氨基酸的同一性。在水溶液中,在生理 pH 值(~6.8)下,氨基将处于质子化的 -NH3+ 形式,羧酸将处于去质子化的 -COO- 形式,形成两性离子。构成蛋白质的大多数氨基酸是 L-异构体,尽管一些奇特的生物在其蛋白质中使用 D-异构体。重要的是要注意,左旋(L)和右旋(D)不特定于直(R)和左(S)构型。蛋白质的左旋形式可以是 R 或 S 构型。左旋和右旋是指蛋白质在旋光仪中如何弯曲光线。
氨基酸通过肽键聚合,肽键是一种酰胺键。肽键是在一个氨基酸的羧基末端与第二个氨基酸的胺末端脱水后形成的。所得羰基的碳原子直接与仲胺的氮原子相连。肽链将在一个末端有一个未结合的氨基自由基(称为 N 末端)和另一个末端有一个自由的羧酸盐基团(称为 C 末端)。
以顺序排列的氨基酸在蛋白质中的书面列表称为它的初级结构。按照惯例,肽序列从 N 末端到 C 末端书写。这种惯例模拟了细胞中核糖体合成多肽的方式。少于 20 个氨基酸的小聚合物更常被称为肽或多肽。蛋白质的序列可以短至 20-30 个氨基酸,也可以长至超过 3,000 个氨基酸的巨型分子(如肌联蛋白,一种人类肌肉蛋白)。
虽然理论上有数十亿种可能的氨基酸,但大多数蛋白质仅由 20 种氨基酸组成:遗传编码的(或更准确地说,蛋白质生成)氨基酸。请注意,除了甘氨酸之外,所有氨基酸在其 α-碳处都有一个手性中心。(甘氨酸在其 α-碳上具有两个氢原子,因此它是非手性的。)除了甘氨酸之外,所有蛋白质生成氨基酸都是L-氨基酸,这意味着它们具有与L-甘油醛相同的绝对构型。这与 S 构型相同,除了半胱氨酸,它在侧链中包含一个硫原子,因此命名优先级发生了变化。D-氨基酸有时在自然界中发现,如某些细菌的细胞壁,但它们很少掺入蛋白质链中。
蛋白质生成氨基酸的侧链变化很大:从单个氢原子(如甘氨酸,最简单的氨基酸)到吲哚杂环(如色氨酸)。有极性、带电和疏水性氨基酸。氨基酸的化学丰富性是蛋白质复杂性和多功能性的基础。
蛋白质翻译后修饰主要有两种类型:一种是切割肽主链的键,另一种是向单个氨基酸的侧链添加或去除官能团。在第一种类型的翻译后修饰中,称为蛋白酶的专门酶识别蛋白质的特定氨基酸并断裂相关的肽键,从而不可逆地修饰一级结构。在第二种主要类型的修饰中,给定蛋白质的氨基酸侧链通过酶促反应进行化学修饰或自发形成(非酶促)。侧链修饰的例子很多,但常见的例子包括氧化、酰化、糖基化(添加聚糖或糖)、甲基化和磷酸化。这两种类型的翻译后修饰都能够对给定蛋白质或酶产生正向和负向控制。
一般来说,蛋白质的功能完全由其结构决定。像 DNA 这样的分子执行一组相当小的功能,其结构几乎是固定的,并且与序列相当独立。相比之下,蛋白质分子执行的功能多种多样,例如消化糖类或运动肌肉。为了执行如此多种不同的功能,蛋白质以多种不同的结构存在。蛋白质的功能几乎完全依赖于蛋白质结构。酶必须识别和与它们的底物反应,并在三维空间中精确定位关键的化学基团。支架蛋白必须能够精确地对接其他蛋白质或组分,并将它们以正确的方式定位在空间中。像胶原蛋白这样的结构蛋白必须承受机械应力,并且能够构建一个规则的基质,细胞可以在其中附着和增殖。马达蛋白必须以精确的方式将化学能可逆地转化为运动。
正如 Anfinsen 在 1960 年代所证实的,蛋白质通过多肽链自发折叠成最低能量构象来获得其结构。大多数蛋白质不需要任何外部因素来折叠(尽管细胞中存在专门的蛋白质,称为伴侣蛋白,帮助其他错误折叠的蛋白质获得正确的结构)——蛋白质序列本身就唯一决定了结构。通常整个过程在毫秒内完成。尽管蛋白质的化学结构看似简单,但二十种氨基酸在线性序列中的排列组合数量巨大,导致了惊人的蛋白质折叠类型。尽管如此,蛋白质结构还是有一些共同特征:它们几乎都是由少数二级结构元素(蛋白质结构中反复出现的短程结构模式)构成,甚至这些元素的组合方式也经常在常见的基序中重复出现。然而,仍然无法知道给定的蛋白质序列在溶液中会产生什么结构。这被称为蛋白质折叠问题,是现代分子生物学中最重要的开放性问题之一。
如果蛋白质处于不合适的化学(例如高或低 pH 值;高盐浓度;疏水环境)或物理(例如高温;高压)条件下,它们会失去其结构。这个过程称为变性。变性的蛋白质没有确定的结构,并且,尤其是在浓缩的情况下,它们倾向于聚集形成不溶性团块。蛋白质变性绝不是一个奇怪的事件:煮熟的鸡蛋变硬仅仅是因为其蛋白质变性并随后聚集。变性的蛋白质有时可以在恢复到正确环境后重新折叠,但有时这个过程是不可逆的(尤其是在聚集后:煮熟的鸡蛋再次就是一个例子)。最终,蛋白质是导致对病原体或寄生虫的易感性或抵抗力的关键因素。
大量的蛋白质,尤其是大型蛋白质,其结构分为几个独立的结构域。这些结构域通常可以在蛋白质中执行特定功能。例如,细胞膜受体可能具有一个细胞外结构域来结合目标分子,以及一个细胞内结构域来结合细胞内的其他蛋白质,从而将信号跨越细胞膜传递。
蛋白质的结构域由蛋白质的二级结构决定,主要有四种结构域类型:α-螺旋、β-折叠、β-转角和无规卷曲。
α-螺旋是多肽链形成螺旋形状,氨基酸侧链伸出,通常长约 10 个氨基酸。α-螺旋通过在螺旋长度上氨基酸 1 和 4 之间形成内部氢键获得强度。一行中高浓度的甘氨酸倾向于形成 α-螺旋构象。
β-折叠结构由多肽链堆叠形成,在折叠之间形成氢键。可以通过在相同方向上堆叠(N-C 末端在 N-C 末端之上)形成平行折叠,或者通过在相反方向上堆叠(N-C 末端在 C-N 末端之上)形成反平行折叠。β-转角通过 4 个氨基酸的环以定义的构象连接两个反平行 β-链。
无规卷曲是蛋白质的一部分,没有确定的二级结构。
蛋白质的结构域来自由这些类型的二级结构组成的肽的独特部分。