结构生物化学/核酸/RNA/RNA 修饰/RNA 剪接
RNA 剪接是 RNA 在初级转录本转录为 mRNA 过程中发生的一种修饰。剪接指的是内含子的切除或去除,以及剩余的序列(称为外显子)的连接。这种修饰发生在细胞核中,在 RNA 被转移到细胞质之前。
剪接发生在生命的所有领域,但不同主要分支之间的剪接类型差异巨大。真核生物剪接许多编码蛋白质的信使 RNA 和一些非编码 RNA。另一方面,原核生物很少剪接,当它们剪接时,主要是非编码 RNA。
RNA 剪接是由两位科学家菲利普·艾伦·夏普和理查德·J·罗伯茨发现的,他们因其成就获得了 1993 年诺贝尔生理学或医学奖。RNA 剪接的最初发现解决了一个早期的悖论,科学家们曾在细胞核中发现了比细胞质中发现的 mRNA 长得多的 RNA。奇怪的核 RNA 具有包含帽子结构的 5' 端和包含聚腺苷酸 [poly(A)] 轨迹的 3' 端,这些结构类似于在细胞质中发现的较短 mRNA 中发现的结构。随后剪接的发现解释了较小的 mRNA 如何具有与较长的核 RNA 相同的末端。虽然末端相同,但长度不同,因为内含子已从链的中部去除。这些内含子被发现证明是对细胞的一个问题,因为例如,几乎四分之一导致 β 地中海贫血的血红蛋白基因突变来自剪接问题。
通过开发复制 RNA 剪接的反应变得很明显,剪接是由 lariat RNA 的分支状部分完成的,并且这些 RNA 是剪接不可或缺的。后来发现这些小的 snRNA 汇集了剪接体中发现的颗粒。通过由 lariatRNA 和 5' 外显子-RNA 组成的中间体,剪接体能够去除内含子。
在真核生物中,基因被转录为信使 RNA,其中包含内含子和外显子。为了产生有效的 mRNA,内含子需要被剪除,而外显子则需要通过剪接体(细胞的分子裁缝)重新连接在一起。剪接体能够改变其剪切和缝合过程,以便根据单个 pre-mRNA 布料卷轴生成 mRNA 变异。可变剪接是剪接体可以从单个 pre-mRNA 布料中开发出多种 mRNA 异构体的方式。这种可变剪接在不增加基因数量的情况下,增强了复杂多细胞生物的进化可能性。
剪接体被认为是真核细胞中最复杂的巨型分子机器之一。它涉及数百种 RNA 和蛋白质机制,特别是组装和拆卸途径。剪接体在真核生物中的主要作用是产生信使 RNA。基因被转录为 mRNA 的前体,称为 pre-mRNA,然后通过剪切和缝合内含子和外显子成分来生成 RNA。内含子是 pre-mRNA 的区域,被剪接体切除以用作非编码 RNA 的来源。外显子编码蛋白质,因此通常是需要的。此外,剪接体可以独特地剪切和缝合,从而产生不同类型的 mRNA,这使得进化允许生物体增加基因数量和复杂性。剪接体被认为是细胞中最复杂的巨型分子机器之一的原因是,它们有责任正确识别和处理大量序列。例如,剪接体最终会处理芽殖酵母中的五种小 RNA 和多达 100 种不同的多肽。为了使事情变得更加复杂,人类甚至需要使用第二种剪接装置,即次要剪接体。在研究这些复杂的机器时,由于体内存在的限制,许多障碍出现了。然而,研究剪接的新方法已经发展起来,例如体外组装和纯化活性剪接体、单一剪接体的显微镜可视化等等。这些方法的优点是它们更具体,并允许研究数百或单个 RNA 分子的更广泛范围。一种新方法涉及使用微阵列。
使用依赖于剪接的微阵列允许研究人员区分剪接循环的哪些特征是通用的,哪些是特定于 pre-mRNA 的。开发的 DNA 阵列组区分剪接和未剪接的 RNA,然后用细胞 RNA 探测以进一步分离。对剪接反应的分析使人们能够观察特定蛋白质活性丧失如何直接影响单个 pre-mRNA 的剪接。总的来说,微阵列通过有效地分离所需的蛋白质,证明了其在 pre-mRNA 识别方面的重要性。
剪接体分析经常会遇到重大障碍,难以深入了解更详细的机制。为了克服这些困难,实验室技术采用了体外方法,包括观察单个 pre-mRNA 分子,以及活性剪接体纯化,包括经过良好表征的酶和受控条件。尽管每种化学方法都相对独特,但每种方法都贡献了互补的协同观点,增强了对剪接机制的了解。
剪接体是一个复杂的巨型分子机器,由小核糖核蛋白颗粒 (snRNP) 组成:U1、U2、U4、U5 和 U6,以及大约 100 种不同的剪接因子。snRNA 的长度在 107-210 个核苷酸之间;snRNA 与蛋白质连接形成小核糖核蛋白颗粒 (snRNP)。snRNP 包含一个单一的 snRNA 和多个蛋白质。
剪接是在多兆道尔顿复合物中进行的。这意味着剪接体是由多个组件以有序的方式组成的。首先,U1 snRNP 结合到 5' 剪接位点 (SS)。同时,分支点桥接蛋白 (BBP) 和 Mud 2 结合到分支点。然后,U2 snRNP 将取代 BBP/Mud 2 并结合到分支点。接下来,U4/U6.U5 三 snRNP 也将结合到该复合物中。在剪接 RNA 之前,U1 和 U4 将离开该复合物,Prp19 将结合。剪接完成后,剪接体将发生构象变化以进行连接过程。连接过程完成后,剪接体的成分将降解并被回收利用。因此,每个剪接体都是一种单次周转酶。
从所有新开发的技术来看,可以确定体内剪接体循环远非简单,而是一个“非凡的动态和灵活的机器”。新技术不断地带来关于 pre-mRNA 底物的详细可逆、不可逆、动力学和机制相互作用的新证据。关于剪接体及其过程,仍然有很多未知之处。仍然缺乏结构信息,这意味着许多功能细节不可用。动力学理解也未知。然而,对这种动态机器的研究仍在发展,并不断发现关于其目的的新方法和信息。
剪接需要内含子中存在三个序列。内含子的一端是 5' 剪接位点,另一端是 3' 剪接位点。在这些位点是短的共有序列。外显子在 mRNA 中的排列顺序通常与相应 DNA 中的序列相对应。该过程由剪接体辅助,剪接体是小的 RNA 分子,识别内含子的开头(通常是 GU)和结尾(通常是 AG),并在这些位点催化剪接。在这些位点改变单个核苷酸可能会阻止剪接发生。也存在自剪接内含子。对剪接很重要的第三个序列位于分支点。分支点是腺嘌呤核苷酸位于 3' 剪接位点之前 18 到 40 个核苷酸的位置。分支点处腺嘌呤核苷酸的缺失或突变会阻止剪接。剪接发生在称为剪接体的大的结构中。
在剪接发生之前,外显子 1 和外显子 2 之间存在一个内含子。前体 mRNA 通过两个步骤进行剪接。第一步,前体 mRNA 在 5' 剪接位点被剪接,将外显子 1 与内含子分离。然后,内含子的 5' 端连接到分支点,向自身折叠,形成一个称为套索的结构。折叠通过 5' 共同序列中的鸟嘌呤核苷酸与分支点处的腺嘌呤核苷酸通过转酯化反应结合而发生。第二步,在 3' 剪接位点进行剪接,外显子 1 的 3' 端连接到外显子 2 的 5' 端。内含子以套索的形式分离,并在分支点处的键断裂后变为线性,然后被核酶降解。最后,仅由拼接在一起的外显子组成的成熟 mRNA 被转移到细胞质中进行翻译。
需要注意的是,5' 帽子极大地影响前体 mRNA 加工和 mRNA 导出,如果它被去除,则被称为 mRNA 降解中的第一个不可逆步骤,这将影响整个基因表达。
前体 mRNA 剪接:组成型 vs 选择性
[edit | edit source]组成型剪接是指 mRNA 以完全相同的方式剪接,每次都使用剪接体。
选择性剪接允许通过 SR 蛋白对基因进行不同的表达,SR 蛋白选择剪接的替代位点,使用不同的外显子或以不同的顺序表达它们。通过选择替代剪接位点的组合,可以创建结构和功能上不同的蛋白质异构体。据估计,至少 75% 的人类基因经历了这种机制。
另一种选择性剪接使用多个 3' 裂解位点。前体 mRNA 序列中存在 2 个或更多个潜在的裂解位点。但是,这可能或可能不会产生不同的蛋白质。
选择性剪接可以在细胞压力下发生
[edit | edit source]由于选择性剪接可以控制基因表达,因此它是细胞在应对某些压力环境和病理细胞状况(如热、冷、紫外线、氧气、离子平衡、感染、炎症、发烧等)时可以利用的重要机制。
剪接因子可以增强(识别正向序列元件)或沉默(识别负向序列元件)。这些序列元件可以是外显子或内含子,这决定了它们是包含(外显子)还是排除(内含子)。剪接增强子通常由 SR 蛋白结合并激活。SR 蛋白是“富含丝氨酸/精氨酸”的蛋白质;它们是一组在进化过程中高度保守的蛋白质,参与选择性和组成型剪接。它们参与调节和选择剪接位点。
示例
选择性或非常规的 mRNA 剪接可以作为某些细胞器(如内质网 (ER))的适应性应激反应的一部分。此外,异常的 mRNA 剪接也可能与细胞凋亡有关。在压力条件下,未折叠的蛋白质在 ER 中积累并形成聚集体。这些异常聚集体会引发称为未折叠蛋白质反应 (UPR) 的反应过程,该过程由存在于 ER 中的几个不同的压力传感器触发。其中一个传感器是肌醇依赖性酶 1α (IRE1α),一种 I 型跨膜蛋白,一旦被激活,就会启动编码转录因子 X 盒结合蛋白 1 (XBP1) 的 mRNA 的异常剪接,导致翻译更稳定的剪接形式的 XBP1 (XBP1s)。XBP1s 易位到细胞核,在那里它控制与蛋白质折叠、质量控制、ERAD 和 ER/高尔基体生物合成相关的 UPR 相关基因子集的上调。此外,ER 长时间应激会导致 IRE1α 信号传导失活,这反过来又与 XBP1 mRNA 剪接的减弱相关,该过程可能使细胞对凋亡敏感。
在热休克蛋白 47 (HSP47) 中,前体 mRNA 非编码区 5' 剪接位点的选择效率更高。在冷休克中,神经纤维瘤病 1 型 (NF1) 中诱导了选择性前体 mRNA 剪接,从而带来了一个隐蔽的外显子。压力诱导的长期神经元超敏反应与压力诱导的神经元乙酰胆碱酯酶 (ACHE) 前体 mRNA 的选择性剪接有关。
热休克应激的影响
[edit | edit source]许多类型的压力,包括热休克,可以立即阻止许多重要的代谢过程,例如 DNA 复制,直到恢复。热休克蛋白 (HSP) 有助于保护细胞免受损伤,并帮助细胞恢复,并在热休克条件消退后。热休克蛋白中前体 mRNA 剪接的阻断是特征明确的。然而,HSP 的表达不受影响,因为它们不包含任何内含子。
SRp38 是一种 SR 蛋白,当过表达时,它会拮抗 SR 蛋白 SF2/ASF(剪接因子 2/选择性剪接因子)的活性。SRp38 的独特之处在于,当被磷酸化时,它会激活需要一个尚未确定的辅助因子的序列特异性剪接。这种活性源于 SRp38 进入与 U1 和前体 mRNA 的复合物,这加强了 U1 和 U2 与前体 mRNA 的相互作用。SRp38 在热休克后去磷酸化后是一个强大的剪接抑制剂;在轻度热休克后,它会被重新磷酸化,伴随着剪接活性的恢复。
核应激体 (nSB) 被认为通过将一组剪接因子带到它们与 SATIII 转录本结合的区域来控制压力下的剪接活性。nSB 是人类细胞中热休克因子 1 (HSF1) 积累的位点,在轻度热休克、化学和高渗应激后短暂出现。它们也是前体 mRNA 剪接因子(SF2/ASF、9G8、SRp30c 用于腺病毒 E1A 基因)积累的位点。nSB 组装在由长卫星 III (SatIII) DNA 组成的染色质区域上。热休克后,染色质重组与 HSF1 转录 SatIII RNA 同时发生。SF2/ASF 和 SRp30c 蛋白的募集需要应激诱导的 SATIII 转录本。减少转录会阻断 SR 蛋白剪接因子的募集。
RNA 剪接的结构洞察
[edit | edit source]对内含子和选择性剪接的研究导致了对真核生物和原核生物中内含子的额外分类。已经发现了两组内含子。第一组内含子,I 类内含子,是第一个被发现的自我剪接核酶。II 类内含子后来被报道。II 类内含子具有高度复杂的 RNA 结构,并且它们还具有独特的多种化学反应活性。II 类内含子具有催化 2'-5' 键形成的能力,以及逆转录到 DNA 的能力。逆转录到 DNA 需要内含子编码蛋白的帮助。对 II 类内含子的二级结构的具体分析揭示了六个结构域。域 V 在系统发育上最为保守(在各种生物群体中密切相关)。域 V 的下部螺旋具有一种催化三联体,它由与称为 U6 剪接体 RNA 的剪接体非常相似的核苷酸组成。这导致人们相信 II 类内含子与核内含子和真核剪接体具有共同的祖先。这导致了对 II 类内含子的进一步细致研究。
II 类内含子的研究
[edit | edit source]II 类内含子根据其 RNA 二级结构被进一步分类为三个主要的结构元素。这三组是 IIA、IIB 和 IIC。逆转录酶分析表明,IIC 类内含子是 II 类内含子中最原始和最简单的谱系。IIC 谱系的二级结构比 IIA 和 IIB 的简单得多。由于 IIC 类内含子更小且更简单,因此它们更受结晶研究的青睐。海洋杆菌 (Oceanobacillus iheyensis) 是第一个成功结晶其 II 类内含子并通过 X 射线衍射进行检查的生物体。IIC 类内含子与 IIA 类和 IIB 类内含子的显著区别在于,剪接第一步中使用的亲核试剂是一个水分子。IIA 类和 IIB 类内含子使用来自域 VI 中腺苷的 2'-OH 亲核试剂。由于 IIC 类内含子使用水分子,因此释放的内含子是线性分子,而 IIA 类和 IIB 类内含子将以套索分支的形式释放。IIC 类内含子的使用进一步表明活性位点由上面提到的域 V 的凸起和催化三联体组成。已经证明,这些区域受到催化金属离子(即镁)结合的影响。这种金属离子相互作用在蛋白质中非常常见,以便影响形状,即 Fe 血红蛋白。离子有助于调节内含子或蛋白质核心处的静电环境。金属离子相互作用还可以形成或破坏 DNA 和 RNA 聚合酶中的磷酸二酯键。
可能的剪接错误
[edit | edit source]虽然剪接错误的发生率很低,但由于多种可能性,偶尔也会发生。剪接错误最有可能导致剪接位点发生突变,并可能导致该位点功能丧失。过早终止密码子的暴露,外显子或内含子的错位/错插入,都可能导致突变。剪接位置变化引起的突变可能导致错误的氨基酸被解读。错误解读的氨基酸可能导致特异性降低。所有突变都可能导致蛋白质构建错误,这可能是危及生命的,例如镰状细胞性贫血或囊性纤维化。幸运的是,许多剪接错误可以通过无义介导的 mRNA 降解机制得到保护。
无义介导的 mRNA 降解是细胞中的一种 mRNA 机制,用于检测错误剪接的信息,并防止错误蛋白质的表达。转录后,mRNA 会与核糖核蛋白重新组装。无义介导的 mRNA 降解是由外显子连接复合体启动的,这些复合体在 mRNA 加工过程中被剪切出来。位于无义密码子之后的 exon 连接复合体充当 mRNA 核糖核蛋白 (RNP) 的标签。RNP 能够识别这些本应被剪切掉的外显子的存在所引起的混乱和错误剪接。无义介导的 mRNA 降解会将带有 exon 标签的错误信息从细胞核转运到细胞质,在那里错误信息 RNA 被降解。
Cellular stress and RNA splicing. Biamonti G, Caceres JF. Trends Biochem Sci. 2009 Mar;34(3):146-53. Epub 2009 Feb 7.
William Fontaigne De La Tour Dautrieve
Aaron A. Hoskins, Melissa J. Moore, The spliceosome: A Flexible, Reversible Macromolecular Machine, Trends in Biochemical Sciences, Volume 37, Issue 5, May 2012. <http://www.sciencedirect.com/science/article/pii/S0968000412000345>
Sharp, Phillip A. "The Discovery of Split Genes and RNA Splicing." Trends in Biochemical Sciences 30.6 (2005): 279-81.
Woehlbier, U., Hetz, C. Modulating stress responses by the UPRosome: A matter of life and death. Trends in Biochemical Sciences, June 2011, Vol. 36, No. 6.