生命科学方法与概念/核酸的结构与功能
肺
核酸是所有已知生命形式所必需的大型生物分子。核酸包括 **脱氧核糖核酸 (DNA)** 和 **核糖核酸 (RNA)**,由称为核苷酸的单体组成。每个核苷酸包含三个组分:一个五碳糖、一个磷酸基团和一个含氮碱基。如果糖是脱氧核糖,聚合物就是 DNA。如果糖是核糖,聚合物就是 RNA。
与蛋白质一起,核酸是最重要的生物大分子;它们在所有生物体中大量存在,在编码、传递和表达遗传信息方面发挥作用——换句话说,信息通过核酸序列传递,或者说 DNA 或 RNA 分子中核苷酸的顺序。以特定序列连接在一起的核苷酸链是通过蛋白质合成储存和传递遗传信息的机制。
**脱氧核糖核酸 (DNA)** 包含所有已知生物体 (除 RNA 病毒外) 发育和功能中使用的遗传指令。携带这种遗传信息的 DNA 片段称为基因。同样,其他 DNA 序列具有结构目的,或参与调节这种遗传信息的利用。
DNA 是一种由称为核苷酸的重复单元组成的长聚合物。DNA 最初由弗里德里希·米歇尔发现并分离,而 DNA 的双螺旋结构是由詹姆斯·沃森和弗朗西斯·克里克发现的,他们利用了罗莎琳·富兰克林和莫里斯·威尔金斯收集的实验数据。所有物种的 DNA 结构都包含两条螺旋链,每条链都绕着同一个轴线盘旋,每条链的螺距为 34 埃 (3.4 纳米),半径为 10 埃 (1.0 纳米)。
在活生物体中,DNA 通常并不以单个分子存在,而是以一对形成双螺旋结构的分子存在。核苷酸重复包含分子主链的片段(将链连接在一起),以及核碱基(与螺旋结构中另一条 DNA 链相互作用)。与糖连接的核碱基称为核苷,而与糖和一个或多个磷酸基团连接的碱基称为核苷酸。包含多个连接的核苷酸的聚合物(如 DNA 中的聚合物)称为多核苷酸。
DNA 链的主链由交替的磷酸基团和糖残基组成。DNA 中的糖是 2-脱氧核糖,它是一种戊糖(五碳)糖。糖通过磷酸基团连接在一起,在相邻糖环的第三和第五个碳原子之间形成磷酸二酯键。这些不对称键意味着 DNA 链具有方向性。在双螺旋结构中,一条链中核苷酸的方向与另一条链中核苷酸的方向相反:链是 *反平行的*。DNA 链的不对称末端分别称为 5'(*五号碳*)末端和 3'(*三号碳*)末端,5' 末端具有末端磷酸基团,而 3' 末端具有末端羟基。DNA 和 RNA 之间的主要区别之一是糖,DNA 中的 2-脱氧核糖被 RNA 中的另一种戊糖核糖替代。
DNA 双螺旋结构主要由两种力稳定:核苷酸之间的氢键和芳香族核碱基之间的碱基堆积相互作用。在细胞的水性环境中,核苷酸碱基的共轭 π 键垂直于 DNA 分子的轴线排列,从而最大程度地减少它们与溶剂化层的相互作用,因此也最大程度地减少吉布斯自由能。DNA 中发现的四种碱基是腺嘌呤(缩写为 A)、胞嘧啶(缩写为 C)、鸟嘌呤(缩写为 G)和胸腺嘧啶(缩写为 T)。这四种碱基连接到糖/磷酸上,形成完整的核苷酸。
核碱基分为两种类型:嘌呤,A 和 G,是融合的五元和六元杂环化合物;嘧啶,六元环 C 和 T。第五种嘧啶核碱基,尿嘧啶 (U),通常在 RNA 中代替胸腺嘧啶,与胸腺嘧啶的不同之处在于其环上缺少一个甲基。除了 RNA 和 DNA 之外,还创建了大量人工核酸类似物,用于研究核酸的性质,或用于生物技术。
双螺旋链形成 DNA 主链。另一个双螺旋结构可能沿着链之间的间隙或沟槽追踪。这些空隙位于碱基对旁边,可能提供一个结合位点。由于链不是对称地彼此定位,因此沟槽的大小不均匀。一个沟槽,主要沟槽,宽 22 埃,另一个沟槽,次要沟槽,宽 12 埃。主要沟槽的宽度意味着碱基边缘在主要沟槽中比在次要沟槽中更容易接近。因此,如转录因子等可以与双链 DNA 中特定序列结合的蛋白质通常与主要沟槽中暴露的碱基侧面接触。这种情况在细胞内 DNA 的异常构象中有所不同(*参见下文*),但主要沟槽和次要沟槽始终命名以反映如果 DNA 扭曲回到普通 B 形状会看到的尺寸差异。
在 DNA 双螺旋结构中,一条链上的每种类型的核碱基都与另一条链上的仅一种类型的核碱基结合。这称为互补碱基配对。这里,嘌呤形成氢键与嘧啶结合,腺嘌呤仅与胸腺嘧啶形成两个氢键,胞嘧啶仅与鸟嘌呤形成三个氢键。这种跨越双螺旋结构的两个核苷酸结合的排列称为碱基对。由于氢键不是共价键,因此它们可以相对容易地断裂和重新连接。因此,双螺旋结构中的两条 DNA 链可以像拉链一样被拉开,无论是通过机械力还是高温。由于这种互补性,DNA 双螺旋结构中所有信息都复制在每条链上,这对于 DNA 复制至关重要。事实上,这种互补碱基对之间可逆且特异的相互作用对于生物体中 DNA 的所有功能至关重要。
由于鸟嘌呤和胞嘧啶形成三个氢键而不是两个,因此具有高 GC 含量(胞嘧啶和鸟嘌呤含量)的 DNA 比具有低 GC 含量的 DNA 更稳定。
如上所述,大多数 DNA 分子实际上是两条聚合物链,以螺旋状方式通过非共价键结合在一起;这种双链结构(**dsDNA**)主要由链内碱基堆积相互作用维持,对于 G、C 堆积来说,这种相互作用最强。两条链可以分开 - 这一过程称为融化 - 形成两个单链 DNA 分子 (**ssDNA**)分子。融化发生在高温、低盐和高 pH 下(低 pH 也会融化 DNA,但由于 DNA 由于酸性脱嘌呤而变得不稳定,因此很少使用低 pH)。
dsDNA 形式的稳定性不仅取决于 GC 含量,还取决于序列(因为堆积是序列特异性的),以及长度(较长的分子更稳定)。稳定性可以用多种方法测量;一种常见的方法是“融化温度”,即 50% 的 ds 分子转化为 ss 分子的温度;融化温度取决于离子强度和 DNA 浓度。因此,DNA 双螺旋结构的 GC 碱基对百分比和总长度决定了 DNA 两条链之间缔合的强度。具有高 GC 含量长 DNA 螺旋结构具有更强的相互作用链,而具有高 AT 含量短螺旋结构具有较弱的相互作用链。在生物学中,需要容易分离的 DNA 双螺旋结构部分,例如某些启动子中的 TATAAT Pribnow 盒,往往具有高 AT 含量,这使得链更容易拉开。
在实验室中,这种相互作用的强度可以通过找到打破氢键所需的温度来测量,即它们的融化温度(也称为 *Tm* 值)。当 DNA 双螺旋结构中的所有碱基对融化时,链会分离,以两个完全独立的分子形式存在于溶液中。这些单链 DNA 分子(*ssDNA*)没有单一的共同形状,但某些构象比其他构象更稳定。
如果 DNA 序列与其被翻译成蛋白质的信使 RNA 拷贝序列相同,则称为“正义”序列。相反链上的序列称为“反义”序列。正义和反义序列都可以在同一 DNA 链的不同部分存在(即,两条链都可以包含正义和反义序列)。在原核生物和真核生物中,都会产生反义 RNA 序列,但这些 RNA 的功能尚不清楚。一种说法是,反义 RNA 通过 RNA-RNA 碱基配对参与调节基因表达。
在原核生物和真核生物中,有一些 DNA 序列,而在质粒和病毒中更多,通过具有重叠基因来模糊正义和反义链之间的界限。在这些情况下,某些 DNA 序列可以兼任两种功能,在沿一条链读取时编码一种蛋白质,而在沿另一链相反方向读取时编码第二种蛋白质。在细菌中,这种重叠可能参与基因转录的调控,而在病毒中,重叠基因增加了可以在小型病毒基因组中编码的信息量。
DNA 可以像绳子一样被扭曲,这个过程被称为 DNA 超螺旋。在 DNA 的“松弛”状态下,一条链通常每 10.4 个碱基对绕双螺旋轴旋转一次,但如果 DNA 被扭曲,链就会变得更加紧密或松散地缠绕。如果 DNA 沿螺旋方向扭曲,这称为正超螺旋,碱基被更紧密地结合在一起。如果它们沿相反方向扭曲,这称为负超螺旋,碱基更容易分开。在自然界中,大多数 DNA 具有轻微的负超螺旋,这是由称为拓扑异构酶的酶引入的。这些酶对于在转录和 DNA 复制等过程中引入 DNA 链的扭曲应力也是必需的。
DNA 存在于许多可能的构象中,包括 A 型 DNA、B 型 DNA 和 Z 型 DNA,尽管只有 B 型 DNA 和 Z 型 DNA 在功能性生物体中被直接观察到。DNA 采用的构象取决于水合水平、DNA 序列、超螺旋的量和方向、碱基的化学修饰、金属离子的类型和浓度,以及溶液中是否存在多胺。
虽然“B 型 DNA 形式”在细胞中发现的条件下是最常见的,但它不是一个明确定义的构象,而是一系列相关的 DNA 构象,它们发生在活细胞中存在的高水合水平下。
与 B 型 DNA 相比,A 型 DNA 形式是更宽的右手螺旋,具有浅而宽的小沟和更窄、更深的大沟。A 型形式在非生理条件下发生在部分脱水的 DNA 样品中,而在细胞中,它可能在 DNA 和 RNA 链的杂交配对中产生,以及在酶-DNA 复合物中产生。碱基被甲基化等化学修饰的 DNA 片段可能会发生更大的构象变化,并采用 Z 型形式。在这里,链绕螺旋轴以左手螺旋的形式旋转,与更常见的 B 型形式相反。这些不寻常的结构可以被特定的 Z 型 DNA 结合蛋白识别,并且可能参与转录的调控。
核糖核酸在将遗传信息从基因转换为蛋白质的氨基酸序列中起作用。三种普遍存在的 RNA 类型包括转移 RNA (tRNA)、信使 RNA (mRNA) 和核糖体 RNA (rRNA)。信使 RNA 充当在 DNA 和核糖体之间传递遗传序列信息的载体,指导蛋白质合成。核糖体 RNA 是核糖体的主要成分,并催化肽键的形成。转移 RNA 充当用于蛋白质合成的氨基酸的载体分子,并负责解码 mRNA。此外,现在已知许多其他类别的 RNA。
RNA 的化学结构与 DNA 非常相似,但在三个主要方面有所不同
- 与双链 DNA 不同,RNA 在其许多生物学作用中是单链分子,并且具有更短的核苷酸链。然而,RNA 可以通过互补碱基配对形成链内双螺旋,就像在 tRNA 中一样。
- 虽然 DNA 包含脱氧核糖,但 RNA 包含核糖(在脱氧核糖中,在 2' 位置的戊糖环上没有连接羟基)。这些羟基使 RNA 比 DNA 稳定性更低,因为它更容易发生水解。
- 腺嘌呤的互补碱基不是胸腺嘧啶,就像在 DNA 中一样,而是尿嘧啶,它是胸腺嘧啶的未甲基化形式。
与 DNA 一样,大多数生物活性 RNA,包括 mRNA、tRNA、rRNA、snRNA 和其他非编码 RNA,都包含自互补序列,这些序列允许 RNA 的部分折叠并与自身配对形成双螺旋。对这些 RNA 的分析表明,它们具有高度结构性。与 DNA 不同,它们的结构不包含长双螺旋,而是由短螺旋集合包装在一起形成类似于蛋白质的结构。通过这种方式,RNA 可以实现化学催化,就像酶一样。例如,对核糖体结构的测定表明,其活性位点完全由 RNA 组成。