结构生物化学/蛋白质进化
蛋白质进化是蛋白质随时间推移发展的一个关键指标。这些研究引导科学家确定了具有相似功能的物种之间蛋白质的关系。同样,同源的蛋白质也适应了不同的功能。进化迫使蛋白质变得更加复杂,因此引导科学家质疑现代蛋白质之前更简单的蛋白质的起源。
蛋白质进化不是一个独立的过程,而是整个生物体的一部分。蛋白质的变化通常只发生在序列水平上,而结构和功能却保持着相当的保守性。这可以用来解释具有相似结构但适应执行不同功能的蛋白质之间同源性的存在。
研究蛋白质进化的两种主要方法是分析和比较蛋白质序列以证明或反驳进化关系,另一种是在体外研究中通过计算模拟进化过程。
一个建议的场景是,最古老的蛋白质是大约 10 个氨基酸的非常小的多肽,由由 RNA 制成的小的原始基因指定。RNA 作为遗传物质的存在早于 DNA 作为遗传物质的存在。编码蛋白质的基因可能以随机顺序连接在一起,而原始的剪接机制将蛋白质拼接在一起。形成的每种蛋白质都将包含一个结构域,其氨基酸的特征长度为 100。进一步的串联将导致多结构域蛋白质,从而形成更复杂的蛋白质。
蛋白质可能进化的另一个场景从包含少于 10 个氨基酸的小肽开始。据说这些短肽随后形成封闭的环,包含 25-30 个氨基酸,并折叠成 100-150 个氨基酸,从而导致多折叠蛋白质。在功能上,少于 10 个氨基酸的短肽不执行任何功能,但是,封闭环蛋白质是有功能的。
结构域的长度通常为 100-150 个氨基酸。这种特征长度通常存在于所有蛋白质中。据信折叠大小出现在 DNA 基因发展早期阶段。DNA 是许多生物体中从 RNA 继承的遗传物质的继承者,是原始的,据信以环状形式存在。DNA 环闭合的最佳尺寸被认为约为 400 个碱基对,这由 DNA 的灵活性决定。400 个碱基对可以编码大约 100-150 个氨基酸,如结构域中所见。因此,DNA 环化的上限对蛋白质结构域的上限有直接影响,两者相互关联。可以说,大多数蛋白质都是从这些古老的封闭环单元进化而来的。
PDZ 结构域是位于细菌、植物和动物结构中的信号蛋白中的一个常见结构域。它们在真核生物和真细菌中广泛存在。大约 90 个残基长,它们在不同的信号蛋白中包含关键的序列同源性区域。通常,PDZ 结构域附着在下一个连续蛋白的 C 端的一个小区域。特别是,这些小区域通过 β 片扩展与 PDZ 结构域结合。隐含地,这意味着 PDZ 结构域通过添加来自结合伴侣的一个末端的 β 链而扩展。PDZ 结构域通常位于其他相互作用模块的组合中,并发挥直接与受体酪氨酸激酶介导的信号传导相关的作用。它还参与其他细胞功能,例如蛋白质运输、突触信号协调和细胞极性启动。
SRC 同源性 3 (SH3) 结构域是一种相对较小的蛋白质,由 60 个氨基酸组成。SH3 结构域倾向于调节衔接蛋白和酪氨酸激酶的活性状态。它们还作为酪氨酸激酶的底物特异性刺激物发挥作用,酪氨酸激酶与活性位点相距很远。SH3 结构域以 β 桶折叠构建,由 5-6 个 β 链组成,紧密包装成反平行 β 片。SH3 结构域的结构是一种经典的折叠,在真核生物和原核生物中很常见。
WD40 结构域是最丰富的结构域之一,也是真核生物中最活跃的结构域之一。它们的功能通过作为细胞网络中心枢纽发挥关键作用,深深地参与细胞过程。WD40 结构域调节不同的蛋白质-蛋白质相互作用,尤其是那些作为支架的相互作用。它们存在于信号转导、细胞分裂、趋化性、RNA 加工和细胞骨架构建等过程中。WD40 结构域首次在牛 β 转导素中发现,β 转导素是三聚体 G 蛋白转导素复合体的亚基。它包含一系列大约 44-60 个残基的序列,折叠成七叶片 β 螺旋桨。每个叶片以四个链反平行 β 片的形式设计。WD40 自然地被利用,因为与其他结构域候选者相比,它在结构上更令人信服。这意味着 WD40 结构域形成的结构与参与细胞内过程的其他结构域相比,具有高度对称性。当缺乏序列的蛋白质需要采用时,对称性至关重要。此外,对称折叠提供了快速便捷的折叠,尤其是对于由离散和局部、非互锁的二级结构单元组成的折叠。不幸的是,WD40 结构域已被证明难以管理。这主要是由于它们通常是较大组件的亚基。此外,它们缺乏测量催化等内在活性的能力。无论如何,WD40 结构域充当支架,并清楚地表征了细胞加工中最重要的结构域家族之一。