跳转到内容

生物化学原理/氨基酸和蛋白质

来自维基教科书,开放世界中的开放书籍

氨基酸是包含胺基(NH2)、羧基(R-C=O-OH)和侧链(通常表示为R)的分子,不同氨基酸之间的侧链不同。氨基酸的关键元素是碳、氢、氧和氮。它们在生物化学中尤为重要,该术语通常指的是α-氨基酸。蛋白质是生物化学化合物,由一个或多个多肽组成,通常以生物功能的方式折叠成球状或纤维状形式。多肽是氨基酸的单一线性聚合物链,通过相邻氨基酸残基的羧基和氨基之间的肽键连接在一起。蛋白质中氨基酸的顺序由基因的序列决定,基因编码在遗传密码中。通常,遗传密码指定 20 种标准氨基酸;然而,在某些生物体中,遗传密码可以包括硒代半胱氨酸——在某些古菌中——吡咯赖氨酸。在合成后不久甚至合成过程中,蛋白质中的残基通常会受到翻译后修饰的化学修饰,这会改变蛋白质的物理和化学性质、折叠、稳定性、活性,最终改变蛋白质的功能。有时,蛋白质具有附着在其上的非肽基团,这些基团被称为辅基或辅因子。蛋白质也可以协同工作以实现特定功能,并且它们经常结合在一起形成稳定的复合物。

多肽最显着的特征之一是它们能够折叠成球状状态或“结构”。蛋白质折叠成特定结构的程度差异很大。一些蛋白质折叠成具有小波动的高刚性结构,因此被认为是单一结构。其他蛋白质在从一种构象到另一种构象之间经历较大重排。这种构象变化通常与信号事件相关。因此,蛋白质的结构充当调节蛋白质功能或酶活性的媒介。并非所有蛋白质都需要折叠过程才能发挥功能,因为一些蛋白质在未折叠状态下发挥功能[1].

与其他生物大分子(如多糖和核酸)一样,蛋白质是生物体的重要组成部分,参与细胞内几乎所有过程。许多蛋白质是催化生化反应的酶,对代谢至关重要。蛋白质还具有结构或机械功能,例如肌肉中的肌动蛋白和肌球蛋白以及细胞骨架中的蛋白质,它们构成维持细胞形状的支架系统。其他蛋白质在细胞信号传导、免疫反应、细胞粘附和细胞周期中很重要。蛋白质在动物的饮食中也是必需的,因为动物无法合成所有需要的氨基酸,必须从食物中获取必需氨基酸。通过消化过程,动物将摄入的蛋白质分解成游离氨基酸,然后用于代谢。

蛋白质最初由荷兰化学家格哈德·约翰内斯·穆尔德描述,并由瑞典化学家永斯·雅各布·贝采利乌斯在 1838 年命名。早期的营养学家,如德国人卡尔·冯·沃伊特,认为蛋白质是维持身体结构最重要的营养物质,因为普遍认为“肉长肉”。然而,直到 1926 年詹姆斯·B·萨默斯证明脲酶实际上是一种蛋白质,蛋白质作为生物体中酶的关键作用才得到充分认识。第一个被测序的蛋白质是胰岛素,由弗雷德里克·桑格完成,他因这一成就获得了 1958 年的诺贝尔奖。第一个被解决的蛋白质结构是血红蛋白和肌红蛋白,分别由马克斯·佩鲁茨和约翰·考德里·肯德鲁爵士在 1958 年完成。这两种蛋白质的三维结构最初是通过 X 射线衍射分析确定的;佩鲁茨和肯德鲁因这些发现共同获得了 1962 年的诺贝尔化学奖。蛋白质可以使用多种技术从其他细胞成分中纯化,例如超速离心、沉淀、电泳和色谱;基因工程的出现使许多方法能够促进纯化。用于研究蛋白质结构和功能的常用方法包括免疫组织化学、定点诱变、核磁共振和质谱分析。分布式计算是研究人员用于检查控制蛋白质折叠的复杂相互作用的相对较新的工具;用于从氨基酸序列(一级结构)计算蛋白质可能的三级结构的统计分析技术非常适合分布式计算环境,这使得原本非常昂贵和耗时的计算变得更加容易管理[2].

氧结合过程的示意视觉模型,显示所有四个单体和血红素,以及仅作为示意线圈的蛋白质链,以方便可视化进入分子。氧气未显示在这个模型中,但是,对于每个铁原子,它都与平坦的血红素中的铁(红色球体)结合。例如,在所示的四个血红素的左上角,氧气结合在左上角所示铁原子的左侧。这会导致铁原子向后移动到容纳它的血红素中(铁在结合氧气时向上移动,在本插图中),拉动组氨酸残基(模型化为铁右侧的红色五边形)更近,正如它所做的那样。反过来,这会拉动持有组氨酸的蛋白质链。

氨基酸

[编辑 | 编辑源代码]
CO-R-N 规则

蛋白质是生物功能的必需物质。有 22 种标准氨基酸,但只有 21 种存在于真核生物中。在 22 种中,有 20 种由通用遗传密码直接编码。人类可以从彼此或从中间代谢的其他分子中合成这 20 种中的 11 种。另外 9 种必须从饮食中摄取,因此被称为必需氨基酸;它们是组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、苏氨酸、色氨酸和缬氨酸。其余两种,硒代半胱氨酸吡咯赖氨酸,通过独特的合成机制整合到蛋白质中。

每个α-氨基酸都包含一个所有氨基酸类型都具有的主链部分,以及一个每个残基类型独特的侧链。脯氨酸是这个规则的例外,其中氢原子被一个与侧链的键取代。由于碳原子与四个不同的基团相连,因此它是手性的,但只有其中一种异构体存在于生物蛋白中。然而,甘氨酸不是手性的,因为它的侧链是氢原子。一个简单的记忆方法是“CORN”:当从正面观察Cα原子时,残基以顺时针方向读作“CO-R-N”。

异构体

标准的**α-氨基酸**,除了甘氨酸外,都可以以两种光学异构体之一的形式存在,分别称为**L或D氨基酸**,它们是彼此的镜像。虽然L-氨基酸代表了核糖体中翻译过程中所有存在于蛋白质中的氨基酸,但D-氨基酸存在于某些由酶翻译后修饰产生的蛋白质中,这些修饰是在翻译后和转运到内质网后发生的,例如在像锥形蜗牛这样的奇异海洋生物中。它们也是细菌肽聚糖细胞壁的主要成分,**D-丝氨酸可能在脑中充当神经递质**。氨基酸构型中的L和D约定并不指氨基酸本身的光学活性,而是指可以理论上从该氨基酸合成的甘油醛异构体的光学活性(D-甘油醛是右旋的;L-甘油醛是左旋的)。或者,(S)和(R)符号用于指示绝对立体化学。蛋白质中几乎所有氨基酸在α碳处都是(S),半胱氨酸是(R),甘氨酸是非手性的。半胱氨酸比较特殊,因为它在侧链的第二个位置有一个硫原子,其原子质量比连接到α碳第一个碳原子的基团更大,因此它是(R)而不是(S)[3]


两性离子

氨基酸中存在的胺和羧酸官能团使其具有两性性质。在称为**等电点**的特定pH值下,氨基酸没有总体电荷,因为质子化的氨基(正电荷)和去质子化的羧基(负电荷)的数量相等。所有氨基酸都有不同的**等电点**。在等电点产生的离子同时具有正负电荷,被称为两性离子,这个词来自德语单词Zwitter,意思是“两性动物”或“杂交”。**氨基酸在固体和极性溶液(如水)中可以以两性离子的形式存在**,但**不能以气体形式存在**。两性离子的溶解度在其等电点时最低,可以通过调节pH值至其特定等电点,将氨基酸从水中沉淀出来[4]


20种天然存在的氨基酸具有不同的物理和化学性质,包括它们的静电荷、pKa、疏水性、大小和特定官能团。这些性质在塑造蛋白质结构中起着重要作用。氨基酸的主要特征在下面的表格中描述。

氨基酸 缩写 备注
丙氨酸 A Ala 非常丰富,用途广泛。比甘氨酸更硬,但足够小,对蛋白质构象只有轻微的立体限制。它表现得相当中性,可以位于蛋白质外部的亲水区域和内部的疏水区域。
天冬酰胺或天冬氨酸 B Asx 当任一氨基酸可能占据一个位置时的占位符。
半胱氨酸 C Cys 硫原子很容易与重金属离子结合。在氧化条件下,两个半胱氨酸可以在二硫键中连接在一起形成胱氨酸。当胱氨酸是蛋白质的一部分时,例如胰岛素,三级结构被稳定,这使得蛋白质更耐受变性;因此,二硫键在必须在恶劣环境中发挥作用的蛋白质中很常见,包括消化酶(例如胃蛋白酶和胰凝乳蛋白酶)和结构蛋白(例如角蛋白)。二硫键也存在于自身无法保持稳定形状的太小的肽中(例如胰岛素)。
天冬氨酸 D Asp 与谷氨酸行为相似。带有强负电荷的亲水性酸性基团。通常位于蛋白质的外部表面,使其可溶于水。与带正电荷的分子和离子结合,通常用于酶中固定金属离子。当位于蛋白质内部时,天冬氨酸和谷氨酸通常与精氨酸和赖氨酸配对。
谷氨酸 E Glu 行为类似于天冬氨酸。具有更长、更灵活的侧链。
苯丙氨酸 F Phe 对人类来说是**必需的**。苯丙氨酸、酪氨酸和色氨酸在侧链上包含大的刚性**芳香族**基团。这些是最大的氨基酸。与异亮氨酸、亮氨酸和缬氨酸一样,这些是疏水性的,倾向于朝向折叠的蛋白质分子的内部定向。苯丙氨酸可以转化为酪氨酸。
甘氨酸 G Gly 由于α碳上的两个氢原子,甘氨酸不是**光学活性的**。它是最小的氨基酸,易于旋转,为蛋白质链增加灵活性。它能够适合最紧密的空间,例如**胶原蛋白**的三螺旋。由于过多的灵活性通常是不希望的,因此作为结构成分,它不如丙氨酸常见。
组氨酸 H His 即使在弱酸性条件下,也会发生氮的**质子化**,改变组氨酸和整个多肽的性质。它被许多蛋白质用作调节机制,在酸性区域(如晚期的**内体**或**溶酶体**)中改变多肽的构象和行为,强制执行酶的构象变化。然而,只需要几个组氨酸来完成这个任务,因此它相对稀少。
异亮氨酸 I Ile 对人类来说是**必需的**。异亮氨酸、亮氨酸和缬氨酸具有大的脂肪族疏水侧链。它们的分子是刚性的,它们之间的疏水相互作用对于蛋白质的正确折叠很重要,因为这些链倾向于位于蛋白质分子的内部。
**亮氨酸**或**异亮氨酸** J Xle 当任一氨基酸可能占据一个位置时的占位符
赖氨酸 K Lys 对人类来说是**必需的**。行为类似于精氨酸。包含一个末端带正电荷的长而灵活的侧链。链的灵活性使赖氨酸和精氨酸适合与表面上具有许多负电荷的分子结合。例如,**DNA**结合蛋白的活性区域富含精氨酸和赖氨酸。强电荷使这两种氨基酸易于位于蛋白质外部的亲水表面;当它们位于内部时,它们通常与相应的带负电荷的氨基酸配对,例如天冬氨酸或谷氨酸。
亮氨酸 L Leu 对人类来说是**必需的**。行为类似于异亮氨酸和缬氨酸。参见异亮氨酸。
蛋氨酸 M Met 对人类来说是**必需的**。总是第一个被掺入蛋白质的氨基酸;有时在翻译后被移除。与半胱氨酸一样,含有硫,但带有**甲基**而不是氢。这个甲基可以被激活,用于许多反应,在这些反应中,一个新的碳原子被添加到另一个分子中。
天冬酰胺 N Asn 类似于天冬氨酸。Asn含有**酰胺**基团,而Asp含有**羧基**。
吡咯赖氨酸 O Pyl 类似于**赖氨酸**,但附着了一个**吡咯啉**环。
脯氨酸 P Pro N 端胺基含有不寻常的环状结构,迫使 CO-NH 酰胺序列处于固定构象。可以破坏蛋白质折叠结构,例如 α螺旋β折叠,从而在蛋白质链中形成所需的扭结。在 胶原蛋白 中很常见,通常会发生 翻译后修饰羟脯氨酸
谷氨酰胺 Q Gln 类似于谷氨酸。Gln 含有 酰胺 基团,而 Glu 含有 羧基。用于蛋白质和作为 的储存。人体中最丰富的氨基酸。
精氨酸 R Arg 在功能上类似于赖氨酸。
丝氨酸 S Ser 丝氨酸和苏氨酸有一个以羟基结尾的短链。它的氢很容易去除,因此丝氨酸和苏氨酸经常在酶中充当氢供体。两者都是非常亲水的,因此可溶性蛋白质的外区往往富含它们。
苏氨酸 T Thr 对人体来说是 必需 的。行为类似于丝氨酸。
硒代半胱氨酸 U Sec 半胱氨酸的 硒化 形式,它取代了
缬氨酸 V Val 对人体来说是 必需 的。行为类似于异亮氨酸和亮氨酸。参见异亮氨酸。
色氨酸 W Trp 对人体来说是 必需 的。行为类似于苯丙氨酸和酪氨酸(参见苯丙氨酸)。血清素 的前体。天然 荧光
未知 X Xaa 当氨基酸未知或不重要时占位符。
酪氨酸 Y Tyr 行为类似于苯丙氨酸(酪氨酸的前体)和色氨酸(参见苯丙氨酸)。黑色素肾上腺素甲状腺激素 的前体。天然 荧光,虽然荧光通常会被能量转移到色氨酸而淬灭。
谷氨酸谷氨酰胺 Z Glx 当任一氨基酸可能占据一个位置时的占位符。


Table of Amino Acids.
真核生物 中发现的 21 种氨基酸,根据其侧链的 pKa生理 pH 7.4 下的电荷进行分组。

氨基酸分类

[edit | edit source]

20 种由遗传密码直接编码的氨基酸可以根据其性质分为几个组。重要的因素包括电荷、亲水性或疏水性、大小和官能团。氨基酸通常根据其侧链的性质分为四组。侧链可以使氨基酸成为弱酸或弱碱,如果侧链是极性的,则为亲水性,如果是非极性的,则为疏水性。

α-氨基酸。图中省略了 CαH 原子。

蛋白质氨基酸通过 缩合反应 组合成单一的 多肽链。这种反应是由 催化核糖体 在称为 翻译 的过程中进行。


必需 非必需
异亮氨酸 丙氨酸
亮氨酸 天冬酰胺
赖氨酸 天冬氨酸
蛋氨酸 半胱氨酸*
苯丙氨酸 谷氨酸
苏氨酸 谷氨酰胺*
色氨酸 甘氨酸*
缬氨酸 脯氨酸*
硒代半胱氨酸*
丝氨酸*
酪氨酸*
精氨酸*
组氨酸*
鸟氨酸*
牛磺酸*

极性和非极性氨基酸及其单字母和三字母代码

氨基酸 三字母代码 单字母代码 侧链极性 侧链电荷 (pH 7.4) 疏水性指数 吸光度 λmax(nm) ε 在 λmax (x10−3 M−1 cm−1)
丙氨酸 Ala A 非极性 中性 1.8
精氨酸 Arg R 极性 正电荷 −4.5
天冬酰胺 Asn N 极性 中性 −3.5
天冬氨酸 Asp D 极性 负电荷 −3.5
半胱氨酸 Cys C 非极性 中性 2.5 250 0.3
谷氨酸 Glu E 极性 负电荷 −3.5
谷氨酰胺 Gln Q 极性 中性 −3.5
甘氨酸 Gly G 非极性 中性 −0.4
组氨酸 His H 极性 正电荷(10%)

中性(90%)

−3.2 211 5.9
异亮氨酸 Ile I 非极性 中性 4.5
亮氨酸 Leu L 非极性 中性 3.8
赖氨酸 Lys K 极性 正电荷 −3.9
蛋氨酸 Met M 非极性 中性 1.9
苯丙氨酸 Phe F 非极性 中性 2.8 257, 206, 188 0.2, 9.3, 60.0
脯氨酸 Pro P 非极性 中性 −1.6
丝氨酸 Ser S 极性 中性 −0.8
苏氨酸 Thr T 极性 中性 −0.7
色氨酸 Trp W 非极性 中性 −0.9 280, 219 5.6, 47.0
酪氨酸 Tyr Y 极性 中性 −1.3 274, 222, 193 1.4, 8.0, 48.0
缬氨酸 Val V 非极性 中性 4.2

此外,还有两种额外的氨基酸,它们通过覆盖终止密码子而被掺入。

第 21 和第 22 个氨基酸 3 个字母 1 个字母
硒代半胱氨酸 Sec U
吡咯赖氨酸 Pyl O

除了特定的氨基酸代码外,在 化学晶体学 分析肽或蛋白质不能确定残基的最终身份的情况下,会使用占位符。

含糊的氨基酸 3 个字母 1 个字母
天冬酰胺或天冬氨酸 Asx B
谷氨酰胺或谷氨酸 Glx Z
亮氨酸或异亮氨酸 Xle J
未指定或未知氨基酸 Xaa X

Unk 有时用作 Xaa 的替代,但标准性较低。

此外,许多非标准氨基酸都有特定的代码。例如,一些肽类药物,例如 硼替佐米MG132人工合成 的,并保留了它们的 保护基,这些保护基有特定的代码。硼替佐米是 Pyz-Phe-boroLeu,而 MG132 是 Z-Leu-Leu-Leu-al。此外,为了帮助分析蛋白质结构,提供了 光交联氨基酸类似物。这些包括光亮氨酸 (pLeu) 和光蛋氨酸 (pMet)。[5]

蛋白质结构

[edit | edit source]
从蛋白质 PCNA 生成的拉曼图,PCNA 是一种人类 DNA 夹 蛋白,由 β折叠α螺旋 组成 (PDB ID 1AXC)。位于轴上的点表示每个亚基的 N-C 末端 残基。绿色区域显示可能包含 甘氨酸 的角形成,而蓝色区域是用于不包含甘氨酸的形成。

蛋白质的一级结构

[edit | edit source]
拉曼图 (φ,ψ 图),其中 α 螺旋残基的数据点形成一个密集的对角簇,位于中心下方和左侧,围绕着主链构象的全局能量最小值。[6]

蛋白质是由α-氨基酸线性链组成的提议,几乎是在1902年同一会议上由两位科学家同时提出的,即在卡尔斯巴德举行的第74届德国科学家和医师协会会议。弗朗茨·霍夫迈斯特在上午提出了这一提议,基于他对蛋白质双缩脲反应的观察。几个小时后,埃米尔·费歇尔紧随其后,他积累了大量支持肽键模型的化学细节。为了完整起见,早在1882年,法国化学家E. 格里莫就提出了蛋白质含有酰胺键的提议。

尽管有这些数据以及后来的证据表明蛋白水解消化的蛋白质只产生寡肽,但蛋白质是氨基酸线性、非分支聚合物的想法并没有立即被接受。一些德高望重的科学家,如威廉·阿斯特伯里,怀疑共价键是否足够强以将如此长的分子连接在一起;他们担心热扰动会将如此长的分子震散。赫尔曼·施陶丁格在 1920 年代也遇到了类似的偏见,当时他认为橡胶是由大分子组成的。因此,出现了几种替代假设。胶体蛋白质假说指出蛋白质是较小分子形成的胶体集合体。该假设在 1920 年代被西奥多·斯维德伯格的超速离心测量结果所证伪,这些测量结果表明蛋白质具有明确的、可重复的分子量,并且被阿恩·蒂塞利乌斯的电泳测量结果所证伪,这些测量结果表明蛋白质是单个分子[7]

第二种假设是环醇假说,由多萝西·林奇提出,该假说认为线性多肽经历了化学环醇重排 C=O + HN C(OH)-N,该重排交联其主链酰胺基团,形成二维织物。各种研究人员提出了蛋白质的其他一级结构,例如埃米尔·阿贝德哈尔登的二酮哌嗪模型和 1942 年特隆斯加德的吡咯/哌啶模型。虽然从未被重视,但这些替代模型最终被弗雷德里克·桑格成功地测序胰岛素以及马克斯·佩鲁茨和约翰·肯德鲁通过晶体学测定肌红蛋白和血红蛋白而证伪。

肽和蛋白质的一级结构是指其氨基酸结构单元的线性序列。“一级结构”一词最早由林德斯特罗姆-朗在 1951 年提出。按照惯例,蛋白质的一级结构是从氨基末端 (N) 末端到羧基末端 (C) 末端报告的。蛋白质的翻译后修饰,如二硫键形成、磷酸化和糖基化,通常也被认为是一级结构的一部分,并且无法从基因中读取[8]

拉马钱德兰图(也称为拉马钱德兰图或拉马钱德兰图或 [φ,ψ] 图),由戈帕拉萨穆德拉姆·纳拉亚纳·拉马钱德兰和维斯瓦纳坦·萨西谢卡兰开发,是一种可视化蛋白质结构中氨基酸残基的二面角 ψ 相对于 φ 的方法。[9]. 它显示了多肽的 ψ 和 φ 角的可能构象。


在数学上,拉马钱德兰图是函数 的可视化。该函数的域是环面。因此,传统的拉马钱德兰图是环面在平面上的投影,导致扭曲的视图和不连续性的存在。人们会期望较大的侧链会导致更多限制,因此在拉马钱德兰图中允许的区域更小。实际上情况并非如此;只有 α 位置的亚甲基基团有影响。甘氨酸在 α 位置有一个氢原子,其范德华半径小于甲基基团。因此它受到的限制最小,这一点在甘氨酸的拉马钱德兰图中很明显,甘氨酸的允许区域要大得多。相反,脯氨酸的拉马钱德兰图仅显示了 ψ 和 φ 的有限的可能组合。拉马钱德兰图是在第一个原子分辨率的蛋白质结构确定之前计算出来的。40 年后,通过 X 射线晶体学确定了数万种高分辨率蛋白质结构,并存储在蛋白质数据库 (PDB) 中。从一千种不同的蛋白质链中,绘制了超过 200 000 个氨基酸的拉马钱德兰图,显示出一些显着差异,尤其是甘氨酸(Hovmöller 等人,2002 年)。发现左上角区域被分成两个;一个在左边包含 β 折叠中的氨基酸,一个在右边包含这种构象的无规卷曲中的氨基酸。也可以用这种方式绘制多糖和其他聚合物中的二面角。对于前两个蛋白质侧链二面角,类似的图是 Janin 图。

蛋白质的二级结构

[edit | edit source]
血红蛋白分子有四个血红素结合亚基,每个亚基主要由 α 螺旋组成。

二级结构是指高度规则的局部亚结构。两种主要的二级结构类型,α 螺旋β 折叠,由莱纳斯·鲍林及其同事在 1951 年提出。[10]. 这些二级结构由主链肽基团之间氢键的模式定义。它们具有规则的几何形状,被限制在拉马钱德兰图上二面角 ψ 和 φ 的特定值。α 螺旋和 β 折叠都代表了一种使肽主链中所有氢键供体和受体饱和的方式。蛋白质中的一些部分是有序的,但没有形成任何规则结构。它们不应与无规卷曲混淆,无规卷曲是缺乏任何固定三维结构的未折叠多肽链。几个顺序的二级结构可以形成“超二级结构单元”。[11]

β 折叠-曲折基序
与鼠单克隆抗体结合的伯氏疏螺旋体外表面蛋白 A 的一部分。

氨基酸在形成各种二级结构元素的能力上有所不同。脯氨酸和甘氨酸有时被称为“螺旋破坏者”,因为它们破坏了 α 螺旋主链构象的规律性;然而,两者都具有不寻常的构象能力,并且通常存在于转角中。更喜欢在蛋白质中采用螺旋构象的氨基酸包括甲硫氨酸、丙氨酸、亮氨酸、谷氨酸和赖氨酸(在氨基酸单字母代码中为“MALEK”);相反,大的芳香族残基(色氨酸、酪氨酸和苯丙氨酸)和 Cβ-支链氨基酸(异亮氨酸、缬氨酸和苏氨酸)更喜欢采用 β 折叠构象。然而,这些偏好不足以产生一种可靠的方法,仅从序列中预测二级结构。蛋白质中的二级结构由氢键介导的局部残基间相互作用组成,或者没有。最常见的二级结构是 α 螺旋和 β 折叠。其他螺旋,如 310 螺旋和 π 螺旋,计算出具有能量上有利的氢键模式,但在天然蛋白质中很少观察到,除了 α 螺旋的末端,因为螺旋中心的骨架堆积不利[12]

α 螺旋

α 螺旋中的氨基酸以右手螺旋结构排列,其中每个氨基酸残基对应于螺旋的 100° 转动(即螺旋每转 3.6 个残基),以及沿螺旋轴的 1.5 Å(0.15 nm)平移。(有时会出现短段左手螺旋,具有大量的非手性甘氨酸氨基酸,但对其他正常的生物 L-氨基酸不利。)α 螺旋的螺距(螺旋连续转动之间的垂直距离)为 5.4 Å(0.54 nm),这是 1.5 和 3.6 的乘积。最重要的是,一个氨基酸的 N-H 基团与前面四个残基的 C=O 基团形成氢键;这种重复的氢键是 α 螺旋最突出的特征。官方国际命名法指定了两种定义 α 螺旋的方式,规则 6.2 涉及重复的 φ,ψ 扭转角,规则 6.3 涉及螺距和氢键的组合模式。不同的氨基酸序列具有不同的形成 α 螺旋结构的倾向。甲硫氨酸、丙氨酸、亮氨酸、未带电荷的谷氨酸和赖氨酸(在氨基酸单字母代码中为“MALEK”)都具有特别高的螺旋形成倾向,而脯氨酸和甘氨酸则具有较差的螺旋形成倾向。脯氨酸要么破坏螺旋,要么使螺旋弯曲,这两种原因都是因为它的酰胺氢不能提供氢键(因为没有酰胺氢),而且它的侧链会对前面转角的骨架造成空间位阻 - 在螺旋内部,这会迫使螺旋轴弯曲约 30°。然而,脯氨酸通常被视为螺旋的第一个残基,这可能是因为它具有结构刚性。另一方面,甘氨酸也倾向于破坏螺旋,因为它具有高度的构象灵活性,使其以熵为代价采用相对受限的 α 螺旋结构[13]

β 发夹的表示
蛋白质结构中的希腊键基序。

β 折叠 第一个 β 折叠结构由威廉·阿斯特伯里在 1930 年代提出。他提出了平行或反平行延伸的 β 折叠之间的氢键的想法。然而,阿斯特伯里没有关于氨基酸键几何形状的必要数据来构建准确的模型,特别是因为他当时还不知道肽键是平面的。莱纳斯·鲍林和罗伯特·科里在 1951 年提出了改进版本。

β 折叠层(也称为 β 折叠片)是蛋白质中第二种常见的规则二级结构形式,仅次于 α 螺旋。β 折叠层由 β 链组成,β 链通过至少两个或三个主链氢键横向连接,形成一个通常扭曲的、褶皱的片层。β 链(也称为 β 链)是多肽链的一部分,通常长 3 到 10 个氨基酸,主链几乎完全伸展。

一个非常简单的涉及 β 折叠层的结构基序是 β 发夹,其中两个反平行链通过 2 到 5 个残基的短环连接,其中一个通常是甘氨酸或脯氨酸,它们都可以采用紧凑转角所需的非寻常二面角构象。然而,单个链也可以通过包含 α 螺旋甚至整个蛋白质结构域的长环以更复杂的方式连接。

希腊键基序 希腊键基序由四个相邻的反平行链及其连接环组成。它由三个通过发夹连接的反平行链组成,而第四个链与第一个链相邻,并通过一个更长的环连接到第三个链。这种类型的结构在蛋白质折叠过程中很容易形成。它以希腊装饰艺术中常见的图案命名(参见蜿蜒(艺术))。


β-α-β 基序 由于其组成氨基酸的手性,所有链都表现出“右手”扭曲,这在大多数高级 β 折叠层结构中很明显。特别是,两个平行链之间的连接环几乎总是具有右手交叉手性,这种手性受到片层的固有扭曲的强烈青睐。这个连接环经常包含一个螺旋区域,在这种情况下它被称为 β-α-β 基序。一个密切相关的基序称为 β-α-β-α 基序,它是最常见观察到的蛋白质三级结构(TIM 桶)的基本组成部分。


β-弯曲基序 一个简单的超二级蛋白质拓扑结构,由 2 个或多个连续的反平行 β 链组成,这些 β 链通过发夹环连接在一起。这种基序在 β 折叠层中很常见,可以在几种结构体系中找到,包括 β 桶和 β 螺旋桨。

Psi 环基序
羧肽酶 A 的一部分。

Psi 环基序 Psi 环(Ψ 环)基序由两个反平行链组成,其中一个链位于两者之间,通过氢键连接到两者。Hutchinson 等人(1990 年)引用了单 Ψ 环的四种可能的链拓扑结构。这种基序很少见,因为导致其形成的过程在蛋白质折叠过程中似乎不太可能发生。Ψ 环首先在天冬氨酸蛋白酶家族中被发现。

卷曲螺旋

1952 年,弗朗西斯·克里克提出了 α 角蛋白的卷曲螺旋的可能性,以及确定其结构的数学方法。值得注意的是,这是在 1951 年莱纳斯·鲍林及其同事提出 α 螺旋结构之后不久提出的。

卷曲螺旋通常包含一个重复的模式,hxxhcxc,疏水性 (h) 和带电荷 (c) 氨基酸残基,称为七肽重复序列。七肽重复序列中的位置通常标记为 abcdefg,其中 a 和 d 是疏水性位置,通常被异亮氨酸、亮氨酸或缬氨酸占据。将具有这种重复模式的序列折叠成 α 螺旋二级结构会导致疏水性残基以“条纹”的形式呈现,这种条纹以左手方式绕螺旋轻轻盘旋,形成两亲结构。两种这样的螺旋在胞质溶胶的充满水的环境中排列的最佳方式是将疏水性链包裹在一起,夹在亲水性氨基酸之间。因此,疏水性表面的埋藏提供了寡聚化的热力学驱动力。卷曲螺旋界面处的堆积异常紧密,在 a 和 d 残基侧链之间几乎完全存在范德华接触。这种紧密堆积最初是由弗朗西斯·克里克在 1952 年预测的,被称为“凸起嵌入孔洞”堆积。α 螺旋可以是平行或反平行的,并且通常采用左手超螺旋。虽然不常见,但也观察到一些右手卷曲螺旋存在于自然界和设计蛋白质中。

三种主要形式的蛋白质螺旋的结构特征
几何属性 α 螺旋 310 螺旋 π 螺旋
每圈残基数 3.6 3.0 4.4
每残基平移 1.5Å 2.0Å 1.1Å
螺旋半径 2.3Å 1.9Å 2.8Å
螺距 5.4Å 6.0Å 4.8Å
蛋白质的四个结构层次,从上到下:一级结构、二级结构(β 折叠层左,α 螺旋右)、三级结构和四级结构。

蛋白质的三级结构

[edit | edit source]

三级结构被认为在很大程度上由蛋白质的一级结构决定——它是由其组成的氨基酸序列。从一级结构预测三级结构的努力通常被称为蛋白质结构预测。然而,蛋白质合成和允许折叠的环境是其最终形状的重要决定因素,通常没有被当前的预测方法直接考虑。在球状蛋白中,三级相互作用通常通过疏水性氨基酸残基在蛋白质核心中的隔离而稳定,水从蛋白质核心被排除,导致蛋白质水暴露表面上的带电荷或亲水性残基富集。在不花时间在胞质溶胶中的分泌蛋白中,半胱氨酸残基之间的二硫键有助于维持蛋白质的三级结构。许多蛋白质在功能和进化上无关,但出现各种常见且稳定的三级结构——例如,许多蛋白质的形状像 TIM 桶,以酶磷酸甘油醛异构酶命名。另一种常见的结构是高度稳定的二聚体卷曲螺旋结构,由 2-7 个 α 螺旋组成。迄今为止已知的蛋白质结构大多是通过 X 射线晶体学实验技术获得的,该技术通常提供高分辨率数据,但没有提供蛋白质构象灵活性的时间依赖性信息。解决蛋白质结构的另一种常见方法是使用核磁共振,它通常提供较低分辨率的数据,并且仅限于相对较小的蛋白质,但可以提供关于蛋白质在溶液中运动的时间依赖性信息。双极化干涉测量法是一种时间分辨分析方法,用于确定表面捕获蛋白质的整体构象和构象变化,为这些高分辨率方法提供补充信息。关于可溶性球状蛋白的三级结构特征比关于膜蛋白的特征了解得更多,因为后者在使用这些方法进行研究方面极其困难。

蛋白质的四级结构

[edit | edit source]

一些蛋白质实际上是多个多肽链的组装体,在更大的组装体的背景下,这些多肽链被称为蛋白质亚基。除了亚基的三级结构之外,多亚基蛋白质还具有四级结构,即亚基组装成的排列。由具有不同功能的亚基组成的酶有时被称为全酶,其中一些部分可能被称为调节亚基,而功能核心被称为催化亚基。具有四级结构的蛋白质的例子包括血红蛋白、DNA 聚合酶和离子通道。其他被称为多蛋白复合物的组装体也具有四级结构。例如,核小体和微管。

四级结构的变化可以通过单个亚基内的构象变化或亚基相对于彼此的重新定向发生。正是通过这些变化,即“多聚体”酶中的协同性和变构性的基础,许多蛋白质发生了调节并执行了它们的生理功能。以上定义遵循了生物化学的经典方法,这种方法是在区分蛋白质和功能性蛋白质单元难以阐明的时候建立的。最近,人们在讨论蛋白质的四级结构时会提到蛋白质-蛋白质相互作用,并将所有蛋白质的组装体视为蛋白质复合物。

蛋白质类型

[编辑 | 编辑源代码]

结合蛋白

[编辑 | 编辑源代码]

结合蛋白是一种通过共价键或弱相互作用与其他化学基团相互作用发挥功能的蛋白质。许多蛋白质仅包含氨基酸而不包含其他化学基团,这些蛋白质被称为简单蛋白质。然而,其他类型的蛋白质在水解时,除了氨基酸外还会产生其他化学成分,这些蛋白质被称为结合蛋白。结合蛋白的非氨基酸部分通常被称为辅基。大多数辅基由维生素组成。结合蛋白根据其辅基的化学性质进行分类。结合蛋白的一些例子是

脂蛋白

[编辑 | 编辑源代码]

脂蛋白是包含蛋白质脂类的生化复合体,脂类与蛋白质结合在一起。许多酶、转运蛋白、结构蛋白、抗原、粘附素和毒素都是脂蛋白。例如,高密度 (HDL) 和低密度 (LDL) 脂蛋白可以使脂肪在血液中运输,线粒体和叶绿体的跨膜蛋白以及细菌脂蛋白。

糖蛋白

[编辑 | 编辑源代码]

糖蛋白是包含寡糖链(聚糖)与多肽侧链共价连接的蛋白质。碳水化合物在共翻译或翻译后修饰过程中连接到蛋白质上。这个过程被称为糖基化。在具有胞外延伸段的蛋白质中,胞外延伸段通常被糖基化。糖蛋白通常是重要的跨膜蛋白,在细胞-细胞相互作用中发挥作用。糖蛋白也存在于细胞质中,但它们的功能以及在该隔室中产生这些修饰的途径知之甚少。糖蛋白通常是结合蛋白中最大和最丰富的群体。它们范围从构成糖萼的细胞表面膜中的糖蛋白,到白细胞产生的重要抗体。

磷蛋白

[编辑 | 编辑源代码]

磷蛋白是与含有磷酸的物质化学结合的蛋白质(有关更多信息,请参见磷酸化)。包含 Fc 受体、Ulks、钙调神经磷酸酶、K 芯片和尿皮质素的生物大分子类别。


金属蛋白

[编辑 | 编辑源代码]

包含金属离子辅因子的蛋白质被称为金属蛋白。金属蛋白在细胞中具有许多不同的功能,例如酶、转运和储存蛋白以及信号转导蛋白。实际上,大约四分之一到三分之一的蛋白质需要金属才能发挥其功能。金属离子通常由多肽链中氨基酸或结合到蛋白质中的大环配体上的氮、氧或硫原子配位。金属离子的存在使金属酶能够执行诸如氧化还原反应之类的功能,这些功能不能轻易地由氨基酸中发现的功能基团有限集执行。

计算机生成的蛋白质锌指基序的三维表示,包括一个α螺旋和一个反平行β折叠离子(绿色)由两个组氨酸残基和两个半胱氨酸残基配位。
金属离子 包含此离子的酶示例
葡萄糖-6-磷酸酶
己糖激酶
DNA 聚合酶
钒蛋白
精氨酸酶
过氧化氢酶
氢化酶
IRE-BP
顺乌头酸酶
[26] 脲酶
氢化酶
细胞色素氧化酶
漆酶
醇脱氢酶
羧肽酶
氨基肽酶
β 淀粉样蛋白
硝酸还原酶
谷胱甘肽过氧化物酶
各种 金属硫蛋白
磷酸酶

血红蛋白

[编辑 | 编辑源代码]

血红蛋白(或血红素蛋白或血红素蛋白)或血红素蛋白,是一种含有血红素辅基的金属蛋白,其共价或非共价结合到蛋白质本身。血红素中的铁能够进行氧化和还原(通常为 +2 和 +3,尽管在过氧化物酶中稳定的 Fe+4 甚至 Fe+5 物种是众所周知的)。血红蛋白可能起源于一种原始策略,该策略允许将血红素原卟啉 IX 环中包含的铁 (Fe) 原子整合到蛋白质中。这种策略在整个进化过程中得以保留,因为它使血红蛋白能够对能结合二价铁 (Fe) 的分子做出反应。这些分子包括但不限于气体分子,如氧气 (O2)、一氧化氮 (NO)、一氧化碳 (CO) 和硫化氢 (H2S)。一旦结合到血红蛋白的辅基血红素基团,这些气体分子就可以以一种被称为信号转导的方式调节这些血红蛋白的活性/功能。因此,当这些气体分子在生物系统(细胞)中产生时,它们被称为气体递质。血红蛋白包含含有铁的辅基,即血红素。血红素基团中的铁离子 (Fe2+) 通过与氧分子结合,将氧分子运输到血液中[27]


血红蛋白 血红蛋白(也拼写为血红蛋白,缩写为 Hb 或 Hgb)是所有脊椎动物(除了鱼类家族棘鱼科)红血球中以及一些无脊椎动物组织中含铁的氧气转运金属蛋白。血液中的血红蛋白将氧气从肺或鳃运输到身体的其他部位(即组织),在那里它释放氧气供细胞使用,并收集二氧化碳将其带回肺部。在哺乳动物中,这种蛋白质约占红血球干重的 97%,约占总含量的 35%(包括水)。血红蛋白的氧气结合能力为每克血红蛋白 1.34 ml O2,这使血液的总氧气容量提高了 70 倍。血红蛋白参与其他气体的转运:它以氨基甲酰血红蛋白的形式携带部分身体的呼吸二氧化碳(总量的约 10%),其中 CO2 与珠蛋白结合。该分子还携带重要的调节分子一氧化氮,其结合在珠蛋白蛋白硫醇基团上,与氧气同时释放。血红蛋白也存在于红血球和它们的祖系以外。其他含有血红蛋白的细胞包括黑质中的 A9 多巴胺能神经元、巨噬细胞、肺泡细胞以及肾脏的系膜细胞。在这些组织中,血红蛋白具有非氧气携带功能,作为抗氧化剂和铁代谢调节剂。血红蛋白和血红蛋白样分子也存在于许多无脊椎动物、真菌和植物中。在这些生物体中,血红蛋白可以携带氧气,或者它们可以充当二氧化碳、一氧化氮、硫化氢和硫化物的转运和调节剂。这种分子的变体,称为豆血红蛋白,用于清除氧气,以防止它毒害无氧系统,例如豆科植物的固氮根瘤[28]。光敏色素,

细胞色素

带有血红素 c 的细胞色素 c。

细胞色素通常是指结合膜的血红蛋白,它们含有血红素基团并执行电子转运。它们存在于真核生物的线粒体内膜和内质网中,植物的叶绿体中,光合微生物中,以及细菌中。它们要么以单体蛋白形式存在(例如,细胞色素 c),要么以催化氧化还原反应的更大酶复合体的亚基形式存在。它们存在于真核生物的线粒体内膜和内质网中、植物的叶绿体中、光合微生物中以及细菌中。

细胞色素 组合
aa3 细胞色素 c 氧化酶(“复合物 IV”),电子由可溶性细胞色素 c传递到复合体(因此得名)
bc1 辅酶 Q - 细胞色素 c 还原酶(“复合物 III”)
b6f 质体醌 - 质体蓝蛋白还原酶
牛视紫红质的三维结构。七个跨膜结构域以不同的颜色显示。发色团以红色显示。
类型 辅基
细胞色素 a 血红素 a
细胞色素 b 血红素 b
细胞色素 d 四吡咯 螯合物 of

视蛋白

[编辑 | 编辑源代码]

视蛋白是一组对光敏感的 35-55 kDa 结合膜的 G 蛋白偶联受体,属于视黄醛蛋白家族,存在于视网膜的光感受器细胞中。五种经典的视蛋白参与视觉,介导光子到电化学信号的转换,这是视觉转导级联反应的第一步。另一种存在于哺乳动物视网膜中的视蛋白,黑视蛋白,参与昼夜节律和瞳孔反射,但不参与成像。

黄素蛋白

[编辑 | 编辑源代码]

黄素蛋白是含有核黄素的核酸衍生物的蛋白质:黄素腺嘌呤二核苷酸 (FAD) 或黄素单核苷酸 (FMN)。黄素蛋白参与广泛的生物过程,包括但不限于生物发光、去除导致氧化应激的自由基、光合作用、DNA 修复和细胞凋亡。黄素辅因子的光谱特性使其成为活性位点内发生变化的天然报告器;这使得黄素蛋白成为研究最多的酶家族之一。


简单蛋白质

[编辑 | 编辑源代码]

水解后只产生氨基酸的蛋白质被称为简单蛋白质。

白蛋白

[编辑 | 编辑源代码]

白蛋白(拉丁语:albus,白色)通常是指任何水溶性蛋白质,在浓盐溶液中中等溶解,并经历热变性。它们通常存在于血浆中,与其他血浆蛋白的不同之处在于它们没有糖基化。含有白蛋白的物质,如蛋清,被称为白蛋白类。

球蛋白

[编辑 | 编辑源代码]

球蛋白是三种血清蛋白中的一种,另外两种是白蛋白和纤维蛋白原。一些球蛋白是在肝脏中产生的,而另一些是由免疫系统产生的。球蛋白一词包含一组异质蛋白质,这些蛋白质通常具有高分子量,溶解度和电泳迁移率都低于白蛋白。

组蛋白

[编辑 | 编辑源代码]

在生物学中,组蛋白是所有真核细胞核和一些古细菌中发现的高度碱性蛋白质,它们将 DNA 包装和排列成称为核小体的结构单元。它们是染色质的主要蛋白质成分,充当 DNA 缠绕的线轴,并在基因调控中发挥作用。

衍生蛋白质

[编辑 | 编辑源代码]

胨是从动物牛奶或肉类经蛋白水解消化而得的。除了含有小肽外,所得的喷雾干燥物质还包括脂肪、金属、盐类、维生素和许多其他生物化合物。胨用于培养细菌和真菌的营养培养基中。

蛋白酶

[编辑 | 编辑源代码]

蛋白酶自然存在于所有生物体中。这些酶参与从简单的食物蛋白质消化到高度调控的级联反应(例如,血液凝固级联、补体系统、细胞凋亡途径和无脊椎动物原酚氧化酶激活级联反应)等多种生理反应。蛋白酶可以根据蛋白质的氨基酸序列,要么断裂特定的肽键(有限蛋白水解),要么将完整的肽分解成氨基酸(无限蛋白水解)。这种活性可能是破坏性的变化,消除蛋白质的功能或将其消化成主要成分;它可能是激活功能,或者它可能是信号通路中的一个信号。

蛋白质的功能

[编辑 | 编辑源代码]

蛋白质作为酶

[编辑 | 编辑源代码]

蛋白质在细胞中最知名的作用是作为酶,催化化学反应。酶通常具有高度特异性,只加速一个或几个化学反应。酶执行大多数代谢反应,以及在 DNA 复制、DNA 修复和转录等过程中操纵 DNA。一些酶作用于其他蛋白质,在称为翻译后修饰的过程中添加或去除化学基团。已知约 4,000 种反应由酶催化。酶催化所带来的速率加速通常是巨大的——以乳清酸脱羧酶为例,与未催化的反应相比,速率提高了 1017 倍(没有酶的情况下需要 7800 万年,有酶的情况下需要 18 毫秒)。酶结合和作用的分子称为底物。尽管酶可以包含数百个氨基酸,但通常只有一小部分残基与底物接触,更少一部分残基(平均三个到四个)直接参与催化。结合底物并包含催化残基的酶区域称为活性位点[29]

蛋白质作为细胞信号分子

[编辑 | 编辑源代码]

许多蛋白质参与细胞信号传导和信号转导过程。一些蛋白质,如胰岛素,是细胞外蛋白质,它们将信号从合成它们的细胞传递到远处组织中的其他细胞。另一些是膜蛋白,充当受体,其主要功能是结合信号分子并在细胞中诱导生化反应。许多受体在细胞表面暴露了结合位点,并在细胞内有一个效应域,该效应域可能具有酶活性或可能发生被细胞内其他蛋白质检测到的构象变化。抗体是适应性免疫系统中的蛋白质成分,其主要功能是结合抗原或体内的外来物质,并将它们靶向破坏。抗体可以分泌到细胞外环境中或锚定在被称为浆细胞的专门 B 细胞的膜中。虽然酶受其反应进行的必要性限制了对其底物的结合亲和力,但抗体没有这种限制。抗体与其靶标的结合亲和力极高。许多配体转运蛋白结合特定的生物小分子并将它们转运到多细胞生物体中的其他位置。这些蛋白质在它们的配体浓度高时必须具有很高的结合亲和力,但在靶组织中浓度低时也必须释放配体。配体结合蛋白的典型例子是血红蛋白,它将氧气从肺部转运到所有脊椎动物的其他器官和组织,并且在每个生物界中都有密切的同源物。凝集素是糖结合蛋白,对它们的糖基团具有高度特异性。凝集素通常在涉及细胞和蛋白质的生物识别现象中发挥作用。受体和激素是高度特异性的结合蛋白。跨膜蛋白也可以充当配体转运蛋白,改变细胞膜对小分子和离子的通透性。膜本身具有疏水核心,极性或带电分子无法通过该核心扩散。膜蛋白包含允许此类分子进入和离开细胞的内部通道。许多离子通道蛋白专门选择特定的离子;例如,钾和钠通道通常只识别两种离子中的一种[30]

其他功能

[edit | edit source]

结构蛋白赋予原本流动的生物成分刚度和硬度。大多数结构蛋白是纤维蛋白;例如,肌动蛋白和微管蛋白作为单体是球状和可溶的,但聚合形成长而坚硬的纤维,构成细胞骨架,使细胞能够保持其形状和大小。胶原蛋白和弹性蛋白是结缔组织(如软骨)的关键成分,角蛋白存在于头发、指甲、羽毛、蹄子和一些动物外壳等坚硬或丝状结构中。其他发挥结构功能的蛋白质是运动蛋白,如肌球蛋白、驱动蛋白和动力蛋白,它们能够产生机械力。这些蛋白质对于单细胞生物的细胞运动和许多以有性方式繁殖的多细胞生物的精子至关重要。它们还产生收缩肌肉所施加的力[31]

蛋白质结构测定

[edit | edit source]
带状图显示了肌红蛋白结构,显示了有色的α螺旋。这些蛋白质是长而线性的分子,具有数千个原子;然而,每个原子的相对位置已经通过 X 射线晶体学以亚原子分辨率确定。由于很难同时可视化所有原子,因此带状图显示了从蛋白质聚合物的 N 末端(蓝色)到其 C 末端(红色)的粗略路径。

蛋白质数据库中约 90% 的可用蛋白质结构是通过 X 射线晶体学确定的。该方法使人们能够测量蛋白质中电子(在结晶状态下)的 3D 密度分布,从而推断出所有原子的 3D 坐标,以达到一定的解析度。大约 9% 的已知蛋白质结构是通过核磁共振技术获得的。可以通过圆二色性或双偏振干涉测量来确定二级结构组成。冷冻电子显微镜最近已成为一种以高分辨率(小于 5 埃或 0.5 纳米)确定蛋白质结构的方法,预计在未来十年,它作为高分辨率工作工具的能力将增强。这项技术对于研究大型蛋白质复合物(如病毒衣壳蛋白和淀粉样蛋白纤维)的研究人员来说仍然是一项宝贵的资源。

X 射线晶体学

[edit | edit source]

生物分子的 X 射线晶体学始于多萝西·克劳福特·霍奇金,她解决了胆固醇(1937 年)、维生素 B12(1945 年)和青霉素(1954 年)的结构,为此她获得了 1964 年的诺贝尔化学奖。1969 年,她成功地解决了胰岛素的结构,她为此工作了三十多年。[32]


X 射线晶体学是一种确定晶体中原子排列的方法,其中一束 X 射线照射到晶体上,并衍射成许多特定方向。蛋白质的晶体结构(不规则且比胆固醇大数百倍)开始在 1950 年代后期得到解决,从抹香鲸肌红蛋白的结构开始,该结构由马克斯·佩鲁茨约翰·肯德鲁爵士确定,为此他们获得了 1962 年的诺贝尔化学奖[33]自从那次成功以来,已经确定了 61840 多种蛋白质、核酸和其他生物分子的 X 射线晶体结构。[34]相比之下,在分析结构方面最接近的竞争方法是核磁共振 (NMR) 光谱,它已经解析了 8759 种化学结构。[35]此外,晶体学可以解决任意大小的分子结构,而溶液状态 NMR 则局限于相对较小的分子(小于 70 kDa)。X 射线晶体学现在被科学家们普遍用于确定药物如何与其蛋白质靶标相互作用以及哪些变化可能改善它。[36]然而,内在膜蛋白仍然难以结晶,因为它们需要去垢剂或其他方法才能在分离时使其溶解,而这些去垢剂通常会干扰结晶。这些膜蛋白是基因组中很大的一部分,包括许多具有重要生理意义的蛋白质,例如离子通道受体[37][38]

核磁共振光谱或 NMR

[edit | edit source]

蛋白质核磁共振光谱(通常缩写为蛋白质 NMR)是结构生物学的一个领域,其中使用 NMR 光谱来获取有关蛋白质结构和动力学的的信息。该领域由理查德·R·恩斯特和库尔特·武特里希[1]等开创。蛋白质 NMR 技术在学术界和生物技术行业中不断被使用和改进。通过 NMR 光谱测定结构通常包含以下几个阶段,每个阶段都使用一组独立的、高度专业化的技术。制备样品、分配共振、生成约束并计算和验证结构

血红蛋白及其结构

[编辑 | 编辑源代码]

血红蛋白是一种携氧蛋白,由 Hünefeld 于 1840 年发现。1851 年,奥托·芬克发表了一系列文章,描述了通过将红细胞依次用纯水、酒精或乙醚等溶剂稀释,然后从所得蛋白质溶液中缓慢蒸发溶剂来生长血红蛋白晶体。血红蛋白的可逆氧合是在几年后由菲利克斯·霍佩-塞勒描述的。1959 年,马克斯·佩鲁茨通过 X 射线晶体学确定了血红蛋白的分子结构。这项工作使他与约翰·肯德鲁共同获得了 1962 年诺贝尔化学奖。生理学家克劳德·贝尔纳阐明了血红蛋白在血液中的作用。血红蛋白这个名字源自血红素和珠蛋白这两个词,反映了血红蛋白的每个亚基都是一个嵌入血红素(或血红素)基团的球状蛋白。每个血红素基团含有一个铁原子,可以与一个氧分子通过离子诱导偶极力结合。哺乳动物中最常见的血红蛋白类型含有四个这样的亚基。血红蛋白(也拼写为血红蛋白,缩写为 Hb 或 Hgb)是所有脊椎动物[1](除了鱼类家族 Channichthyidae)红细胞中含铁的氧气转运金属蛋白,以及一些无脊椎动物的组织中。血液中的血红蛋白负责将氧气从肺部或鳃运输到身体其他部位(即组织),在那里释放氧气供细胞使用,并收集二氧化碳将其带回肺部。在哺乳动物中,这种蛋白质约占红细胞干物质的 97%,约占总含量的 35%(包括水)。血红蛋白的氧气结合能力为每克血红蛋白 1.34 毫升 O2,与溶解在血液中的氧气相比,这使血液的总氧气容量增加了 70 倍。哺乳动物的血红蛋白分子最多可以结合(携带)四个氧分子[39]

血红蛋白主要由蛋白质(“珠蛋白”链)组成,而这些蛋白质反过来又由氨基酸序列组成。这些序列是线性的,就像书面句子中的字母或串珠一样。在所有蛋白质中,蛋白质中氨基酸序列中氨基酸类型的变化决定了蛋白质的化学性质和功能。血红蛋白也是如此,其中氨基酸序列可能会影响关键功能,例如蛋白质对氧气的亲和力。

存在不止一个血红蛋白基因。血红蛋白中珠蛋白的氨基酸序列通常在物种之间存在差异,尽管差异随着物种之间的进化距离而增大。例如,人类和黑猩猩中最常见的血红蛋白序列几乎相同,在α和β珠蛋白链中仅相差一个氨基酸。这些差异在亲缘关系较远的物种之间会更大。即使在同一个物种中,血红蛋白的不同变体也总是存在,尽管一个序列通常是每个物种中“最常见”的序列。物种中血红蛋白蛋白基因的突变会导致血红蛋白变体。许多这些突变形式的血红蛋白不会引起疾病。然而,其中一些突变形式的血红蛋白会导致一组遗传性疾病,称为血红蛋白病。最著名的血红蛋白病是镰状细胞病,这是第一种在分子水平上了解其机制的人类疾病。一组(大部分)独立的疾病称为地中海贫血,涉及正常和有时异常血红蛋白的生产不足,这是由于珠蛋白基因调控问题和突变引起的。所有这些疾病都会导致贫血[40]

血红蛋白变异是正常胚胎和胎儿发育的一部分,但也可能是人群中由遗传变异引起的病理学血红蛋白突变形式。一些众所周知的血红蛋白变异,如镰状细胞性贫血,会导致疾病,被认为是血红蛋白病。其他变异不会引起可检测到的病理,因此被认为是非病理性变异[41]

在胚胎中:Gower 1 (ζ2ε2) Gower 2 (α2ε2) (PDB 1A9W) 血红蛋白波特兰 (ζ2γ2) 在胎儿中:胎儿血红蛋白 (α2γ2) (PDB 1FDH)

在成年人中:血红蛋白 A (α2β2) (PDB 1BZ0) - 最常见,正常含量超过 95% 血红蛋白 A2 (α2δ2) - δ 链合成始于第三孕期的后期,在成年人中,其正常范围为 1.5-3.5% 胎儿血红蛋白 (α2γ2) - 在成年人中,胎儿血红蛋白仅限于被称为 F 细胞的有限红细胞群体。然而,Hb F 的水平在镰状细胞病和 β 地中海贫血患者中可能会升高。

引起疾病的变异形式:血红蛋白 H (β4) - 血红蛋白的一种变异形式,由 β 链的四聚体形成,可能存在于 α 地中海贫血的变体中。血红蛋白巴特 (γ4) - 血红蛋白的一种变异形式,由 γ 链的四聚体形成,可能存在于 α 地中海贫血的变体中。血红蛋白 S (α2βS2) - 在患有镰状细胞病的人中发现的血红蛋白的一种变异形式。β 链基因存在变异,导致血红蛋白性质发生改变,从而导致红细胞发生镰状化。血红蛋白 C (α2βC2) - 另一种由于 β 链基因变异引起的变异。这种变异会导致轻度慢性溶血性贫血。血红蛋白 E (α2βE2) - 另一种由于 β 链基因变异引起的变异。这种变异会导致轻度慢性溶血性贫血。血红蛋白 AS - 一种杂合形式,导致镰状细胞性状,具有一个成人基因和一个镰状细胞病基因 血红蛋白 SC 病 - 另一种杂合形式,具有一个镰状基因和另一个编码血红蛋白 C 的基因。

血红蛋白氨基酸序列的变异,与其他蛋白质一样,可能是适应性的。例如,最近的研究表明鹿鼠中遗传变异有助于解释山区鹿鼠如何在稀薄的空气中生存。内布拉斯加林肯大学的一位研究人员发现,四个不同基因的突变可以解释生活在低地草原和山区之间的鹿鼠之间的差异。在检查从高地和低地捕获的野生老鼠后,发现:这两个品种的基因“几乎相同——除了那些控制其血红蛋白携氧能力的基因”。“这种基因差异使高地老鼠能够更有效地利用氧气”,因为在海拔较高的地方(如山区)氧气较少。猛犸血红蛋白具有突变,使其能够在较低温度下输送氧气,从而使猛犸象能够在更新世时期迁移到较高的纬度。

镰状细胞病以常染色体隐性遗传方式遗传。
镰状细胞性状的分布,用粉红色和紫色表示
疟疾历史分布(欧洲不再流行)用绿色表示
疟疾的现代分布

镰状细胞病(SCD)或镰状细胞性贫血(或贫血;SCA)或镰状细胞病是一种常染色体隐性遗传性血液疾病,具有超显性,其特征是红细胞呈现异常的、坚硬的镰状形状。镰状化降低了细胞的柔韧性,导致各种并发症的风险。镰状化是由于血红蛋白基因发生突变造成的。预期寿命缩短,研究报告称男性平均预期寿命为 42 岁,女性为 48 岁。镰状细胞性贫血是由血红蛋白 β 珠蛋白链中的点突变引起的,导致亲水性氨基酸谷氨酸在第六位被疏水性氨基酸缬氨酸取代。β 珠蛋白基因位于 11 号染色体短臂上。两个野生型 α 珠蛋白亚基与两个突变 β 珠蛋白亚基的结合形成了血红蛋白 S (HbS)。在低氧条件下(例如,在高海拔地区),β 珠蛋白链第 6 位缺乏极性氨基酸会导致血红蛋白非共价聚合(聚集),这会使红细胞扭曲成镰刀状,并降低其弹性。

红细胞弹性的丧失是镰状细胞病病理生理的关键。正常的红细胞具有很强的弹性,这使得细胞能够变形以通过毛细血管。在镰状细胞病中,低氧张力会导致红细胞发生镰状化,反复发生的镰状化会损伤细胞膜并降低细胞的弹性。当恢复正常氧张力时,这些细胞无法恢复正常形状。因此,这些坚硬的血液细胞在通过狭窄的毛细血管时无法变形,导致血管闭塞和缺血。疾病的实际贫血是由溶血引起的,即脾脏内红细胞的破坏,因为其形状不规则。虽然骨髓试图通过生成新的红细胞来弥补,但它无法与破坏的速度相匹配。健康的红细胞通常存活 90-120 天,而镰状细胞仅存活 10-20 天。通常,人类有血红蛋白 A,由两个α链和两个β链组成,血红蛋白 A2,由两个α链和两个δ链组成,以及血红蛋白 F,由两个α链和两个γ链组成。其中,血红蛋白 A 约占人体正常血红蛋白的 96-97%。

镰状细胞基因突变可能是在不同的地理区域自发产生的,正如限制性内切酶分析所表明的那样。这些变异被称为喀麦隆、塞内加尔、贝宁、班图和沙特阿拉伯-亚洲。它们的临床意义在于,其中一些与较高的 HbF 水平相关,例如塞内加尔和沙特阿拉伯-亚洲变异,并且往往表现出较轻的疾病。[42]

对于 HgbS 杂合子(镰状血红蛋白携带者),聚合问题较小,因为正常等位基因能够产生超过 50% 的血红蛋白。对于 HgbS 纯合子,HbS 长链聚合物的存在会使红细胞的形状从光滑的甜甜圈状变为参差不齐并充满尖刺,使其变得脆弱,容易在毛细血管内破裂。携带者只有在缺氧(例如,登山时)或严重脱水时才会出现症状。在正常情况下,这些疼痛性发作每年每位患者约发生 0.8 次。镰状细胞病发生在当第 7 个氨基酸(如果从最初的甲硫氨酸开始计算)谷氨酸被缬氨酸取代时,从而改变其结构和功能。

基因缺陷是一种已知的 突变,它导致 β-珠蛋白基因中单个核苷酸 (单核苷酸多态性 - SNP) (A 到 T) 发生改变,导致谷氨酸在第 6 位被 缬氨酸取代。带有这种突变的血红蛋白 S 被称为 HbS,以区别于正常的成人 HbA。这种遗传疾病是由 突变引起的,它导致单个核苷酸从 GAG 突变为 GTG 密码子 突变,通过转录成为 GUG 密码子。这通常是一个良性突变,对血红蛋白的 二级三级四级结构 没有明显影响,前提是在正常的 氧气 浓度下。它允许在低 氧气 浓度下,HbS 本身发生聚合。血红蛋白的脱氧形式在 E 和 F 螺旋之间暴露了蛋白质上的疏水性斑块。血红蛋白 β 链第 6 位缬氨酸的疏水性残基能够与疏水性斑块结合,导致血红蛋白 S 分子聚集并形成纤维状沉淀物。

导致镰状细胞性贫血的 等位基因常染色体 隐性 的,位于 11 号染色体短臂上。从父母双方都遗传了缺陷基因的人会患病;从父母双方各遗传一个缺陷基因和一个正常基因的人会保持健康,但会将疾病遗传给后代,被称为 携带者。如果两个携带者父母生育孩子,他们的孩子患病的概率为 1/4,成为携带者的概率为 1/2。由于该基因是不完全隐性的,携带者可能会产生一些镰状红细胞,不足以引起症状,但足以对疟疾产生抵抗力。因此,杂合子比任何一个纯合子具有更高的

适应性。这被称为 杂合子优势。由于杂合子的适应性优势,这种疾病仍然很普遍,特别是在最近祖先来自疟疾流行地区的群体中,例如 非洲地中海印度中东[43] 疟疾在历史上是地中海南部的地方病,但在 20 世纪中叶被宣布根除,除了偶尔发生的罕见病例。[44] 疟原虫具有复杂的生命周期,其中的一部分是在红细胞中度过的。在携带者中,疟原虫的存在会导致带有缺陷血红蛋白的红细胞过早破裂,使 疟原虫 无法繁殖。此外,Hb 的聚合影响了疟原虫消化 Hb 的能力。因此,在疟疾流行的地区,如果人们携带镰状细胞性状(对杂合子的选择),他们的生存机会实际上会增加。在美国,由于没有疟疾流行,黑人中的镰状细胞性贫血患病率(约 0.25%)低于 西非(约 4.0%),并且正在下降。如果没有来自非洲的疟疾流行,镰状细胞突变纯粹是弊大于利,并且会倾向于从受影响的群体中被淘汰。限制镰状细胞基因在北美传播的另一个因素是缺乏对一夫多妻制的文化倾向。[45] 遗传 镰状细胞疾病的遗传方式与血型、头发颜色和质地、眼睛颜色和其他身体特征的遗传方式大致相同。一个人在红细胞中产生的血红蛋白类型取决于他从父母那里遗传的血红蛋白基因。如果一方父母患有镰状细胞性贫血(SS),而另一方父母是镰状细胞性状携带者(AS),那么孩子患有镰状细胞病(SS)的概率为 50%,患有镰状细胞性状(AS)的概率为 50%。当父母双方都是镰状细胞性状携带者(AS)时,孩子患有镰状细胞病(SS)的概率为 25%(1/4),如上图所示。

血红素 b 组

血红蛋白具有许多多亚基球状蛋白的四级结构特征。血红蛋白中大多数氨基酸形成α螺旋,由短的非螺旋段连接。氢键稳定了这种蛋白质内部的螺旋部分,在分子内引起吸引力,将每个多肽链折叠成特定的形状。血红蛋白的四级结构来自其四个亚基,大致呈四面体排列。在大多数脊椎动物中,血红蛋白分子是由四个球状蛋白质亚基组成的集合。每个亚基都由一个与非蛋白质血红素基团紧密结合的蛋白质链组成。每个蛋白质链排列成一组α螺旋结构片段,这些片段以球蛋白折叠方式连接在一起,之所以被称为球蛋白折叠,是因为这种排列是其他血红素/球蛋白蛋白(如肌红蛋白)中使用的相同折叠基序。这种折叠模式包含一个强力结合血红素基团的口袋。血红素基团由一个位于杂环环中的铁 (Fe) 离子(带电原子)组成,被称为卟啉。这种卟啉环由四个吡咯分子以环状方式连接在一起(通过甲烯桥),铁离子位于中心。铁离子是氧结合位点,与环中心的四个氮配位,所有四个氮都位于同一个平面上。铁通过 F8 组氨酸残基(也称为近端组氨酸)的咪唑环与球状蛋白牢固(共价)结合,该残基位于卟啉环下方。第六个位置可以通过配位共价键可逆地结合氧气[24],完成六个配体的八面体基团。氧气以“端向弯曲”几何形状结合,其中一个氧原子结合 Fe,另一个氧原子以一定角度突出。当没有氧气结合时,一个结合非常弱的水分子会填充该位点,形成一个扭曲的八面体。尽管二氧化碳是由血红蛋白携带的,但它并不与氧气竞争铁结合位点,而是实际结合到结构的蛋白质链上。铁离子可以处于 Fe2+ 状态或 Fe3+ 状态,但高铁血红蛋白(高铁血红蛋白)(Fe3+)不能结合氧气。在结合过程中,氧气暂时且可逆地将 (Fe2+) 氧化为 (Fe3+),而氧气暂时转化为超氧化物,因此铁必须处于 +2 氧化态才能结合氧气。如果与 Fe3+ 结合的超氧化物离子被质子化,血红蛋白铁将保持氧化状态,无法结合氧气。在这种情况下,高铁血红蛋白还原酶最终可以通过还原铁中心来重新激活高铁血红蛋白。在成年人中,最常见的血红蛋白类型是四聚体(包含 4 个亚基蛋白),称为血红蛋白 A,由两个 α 亚基和两个 β 亚基非共价结合组成,每个亚基分别由 141 个和 146 个氨基酸残基组成。这表示为 α2β2。亚基在结构上相似,大小也差不多。每个亚基的分子量约为 17,000 道尔顿,四聚体的总分子量约为 68,000 道尔顿(64,458 g/mol)[26]。因此,1 g/dL = 0.01551 mmol/L。血红蛋白 A 是研究最深入的血红蛋白分子。在人类婴儿中,血红蛋白分子由 2 条 α 链和 2 条 γ 链组成。随着婴儿的成长,γ 链逐渐被 β 链取代。四个多肽链通过盐桥、氢键和疏水效应相互结合。α 链和 β 链之间有两种类型的接触:α1β1 和 α1β2。

氧饱和度 一般来说,血红蛋白可以与氧分子饱和(氧合血红蛋白),也可以与氧分子脱饱和(脱氧血红蛋白)。

氧合血红蛋白 氧合血红蛋白是在生理呼吸过程中形成的,此时氧气与红细胞中蛋白质血红蛋白的血红素成分结合。这个过程发生在肺泡附近的肺毛细血管中。然后,氧气通过血液循环被运送到细胞中,并在有氧糖酵解以及通过氧化磷酸化过程产生 ATP 中被利用。但是,它不能帮助抵消血液 pH 值的下降。通气或呼吸可以通过去除二氧化碳来逆转这种情况,从而导致 pH 值上升。血红蛋白存在两种形式,紧张形式 (T) 和松弛形式 (R)。各种因素,如低 pH 值、高 CO2 和高 2,3-BPG 在组织水平上有利于紧张形式,这种形式的氧亲和力低,并在组织中释放氧气。在肺毛细血管水平上,上述因素的反面有利于松弛形式,它可以更好地结合氧气[46]

脱氧血红蛋白 脱氧血红蛋白是未结合氧气的血红蛋白形式。氧合血红蛋白和脱氧血红蛋白的吸收光谱不同。氧合血红蛋白在 660 nm 波长下的吸收量明显低于脱氧血红蛋白,而在 940 nm 波长下的吸收量略高。这种差异用于通过名为脉搏血氧仪的仪器测量患者血液中的氧气含量。这种差异也解释了发绀的出现,即组织在缺氧期间会呈现的蓝紫色。氧合血红蛋白是在生理呼吸过程中形成的,此时氧气与红细胞中蛋白质血红蛋白的血红素成分结合。这个过程发生在肺泡附近的肺毛细血管中。然后,氧气通过血液循环被运送到细胞中,并在有氧糖酵解以及通过氧化磷酸化过程产生 ATP 中被利用。但是,它不能帮助抵消血液 pH 值的下降。通气或呼吸可以[47]

参考文献

[编辑 | 编辑源代码]
  1. http://en.wikipedia.org/w/index.php?title=Protein&oldid=422392976
  2. http://en.wikipedia.org/w/index.php?title=Protein&oldid=422392976
  3. http://en.wikipedia.org/w/index.php?title=Amino_acid&oldid=425052968
  4. http://en.wikipedia.org/w/index.php?title=Amino_acid&oldid=425052968
  5. Photo-leucine 和 photo-methionine 允许在活细胞中识别蛋白质-蛋白质相互作用。Nature Methods:4,261–7,2005
  6. Lovell SC; 等人 (2003). "通过 Cα 几何形状进行结构验证:φ,ψ 和 Cβ 偏差". Proteins. 50 (3): 437–450. doi:10.1002/prot.10286. PMID 12557186. {{cite journal}}: 显式使用 et al. 在:|author= (帮助)
  7. http://en.wikipedia.org/w/index.php?title=Protein_primary_structure&oldid=415921787
  8. http://en.wikipedia.org/w/index.php?title=Protein_primary_structure&oldid=415921787
  9. RAMACHANDRAN GN, RAMAKRISHNAN C, SASISEKHARAN V (1963 年 7 月). "多肽链构型的立体化学". J. Mol. Biol. 7: 95–9
  10. Pauling L, Corey RB, Branson HR (1951). "蛋白质的结构;多肽链的两种氢键螺旋构型". Proc Natl Acad Sci USA. 37 (4): 205–211. doi:10.1073/pnas.37.4.205. PMC 1063337. PMID 14816373.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  11. Chiang YS, Gelfand TI, Kister AE, Gelfand IM (2007). "三明治状蛋白质的超二级结构的新分类揭示了链组装的严格模式". Proteins. 68 (4): 915–921. doi:10.1002/prot.21473. PMID 17557333.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  12. http://en.wikipedia.org/w/index.php?title=Protein_secondary_structure&oldid=406816422
  13. http://en.wikipedia.org/w/index.php?title=Alpha_helix&oldid=423162580
  14. http://en.wikipedia.org/w/index.php?title=Beta_sheet&oldid=425195965
  15. 蛋白质三级结构和折叠:第 4.3.2.1 节. 来自 蛋白质结构、比较蛋白质建模和可视化的原理
  16. Hutchinson EG, Thornton JM (1993 年 4 月). "希腊键基序:提取、分类和分析". Protein Eng. 6 (3): 233–45. doi:10.1093/protein/6.3.233. PMID 8506258.
  17. http://en.wikipedia.org/w/index.php?title=Beta_sheet&oldid=425195965
  18. http://en.wikipedia.org/w/index.php?title=Beta_sheet&oldid=425195965
  19. SCOP:折叠:WW 结构域样
  20. PPS '96 - 超二级结构
  21. http://en.wikipedia.org/w/index.php?title=Beta_sheet&oldid=425195965
  22. Hutchinson, E. (1996). "PROMOTIF——识别和分析蛋白质结构基序的程序". Protein Science. 5 (2): 212–220. doi:10.1002/pro.5560050204. PMC 2143354. PMID 8745398. {{cite journal}}: 引用中有一个空的未知参数:|month= (帮助); 未知参数 |coauthors= 被忽略 (|author= 被推荐) (帮助)
  23. Hutchinson EG, Thornton JM (1990). "HERA——绘制蛋白质二级结构示意图的程序". Proteins. 8 (3): 203–12. doi:10.1002/prot.340080303. PMID 2281084.
  24. http://en.wikipedia.org/w/index.php?title=Coiled_coil&oldid=420935661
  25. 史蒂文·博特利(2004)。"蛋白质结构交互式教程". 检索于 2011年1月9日. {{cite web}}: 检查 |authorlink= 值 (帮助); 外部链接在 |authorlink= (帮助)
  26. Astrid Sigel, Helmut Sigel 和 Roland K.O. Sigel(编)(2008)。镍及其在自然界中的惊人影响。生命科学中的金属离子。第2卷。Wiley。 ISBN 978-0-470-01671-8.
  27. http://en.wikipedia.org/w/index.php?title=Hemeprotein&oldid=410476687
  28. http://en.wikipedia.org/w/index.php?title=Hemoglobin&oldid=424939141
  29. http://en.wikipedia.org/w/index.php?title=Protein&oldid=422392976
  30. http://en.wikipedia.org/w/index.php?title=Protein&oldid=422392976
  31. http://en.wikipedia.org/w/index.php?title=Protein&oldid=422392976
  32. 多萝西·克劳福特·霍奇金 (1935). "胰岛素的 X 射线单晶照片". 自然. 135: 591. doi:10.1038/135591a0.
  33. 约翰·肯德鲁; 等. (1958-03-08). "通过 X 射线分析获得的肌红蛋白分子的三维模型". 自然. 181 (4610): 662. doi:10.1038/181662a0. PMID 13517261. {{cite journal}}: |author= 中显式使用等. (帮助)
  34. "按实验方法排列的 PDB 条目表".
  35. "PDB 统计". RCSB 蛋白质数据库. 检索于 2010-02-09.
  36. Scapin G (2006). "结构生物学和药物发现". Curr. Pharm. Des. 12 (17): 2087. doi:10.2174/138161206777585201. PMID 16796557.
  37. Lundstrom K (2006). "膜蛋白的结构基因组学". Cell. Mol. Life Sci. 63 (22): 2597. doi:10.1007/s00018-006-6252-y. PMID 17013556.
  38. Lundstrom K (2004). "膜蛋白的结构基因组学:小型综述". Comb. Chem. High Throughput Screen. 7 (5): 431. PMID 15320710.
  39. http://en.wikipedia.org/w/index.php?title=Hemoglobin&oldid=424939141
  40. http://en.wikipedia.org/w/index.php?title=Hemoglobin&oldid=424939141
  41. http://en.wikipedia.org/w/index.php?title=Hemoglobin&oldid=424939141
  42. Green NS, Fabry ME, Kaptue-Noche L, Nagel RL (1993). "塞内加尔单倍型与非洲镰状细胞性贫血儿童的贝宁和喀麦隆单倍型相比具有更高的 HbF". Am. J. Hematol. 44 (2): 145–6. doi:10.1002/ajh.2830440214. ISSN 0361-8609. PMID 7505527. {{cite journal}}: 未知参数 |month= 被忽略 (帮助)CS1 maint: 多个名字:作者列表 (链接)
  43. Kwiatkowski DP (2005). "疟疾如何影响人类基因组,以及人类遗传学能教会我们什么关于疟疾的知识". Am. J. Hum. Genet. 77 (2): 171–92. doi:10.1086/432519. ISSN 0002-9297. PMC 1224522. PMID 16001361. {{cite journal}}: Unknown parameter |month= ignored (help) Template:PMC
  44. Ponçon N, Toty C, L'Ambert G; et al. (2007). "法国南部潜在疟疾媒介的生物学和动态". Malar. J. 6: 18. doi:10.1186/1475-2875-6-18. PMC 1808464. PMID 17313664. {{cite journal}}: Explicit use of et al. in: |author= (help)CS1 maint: multiple names: authors list (link)
  45. Lesi FE, Bassey EE (1972). "尼日利亚镰状细胞病的家庭研究". J Biosoc Sci. 4 (3): 307–13. doi:10.1017/S0021932000008622. PMID 5041262. {{cite journal}}: Unknown parameter |month= ignored (help)
  46. http://en.wikipedia.org/w/index.php?title=Hemoglobin&oldid=424939141
  47. http://en.wikipedia.org/w/index.php?title=Hemoglobin&oldid=424939141

粗体文本

华夏公益教科书