结构生物化学/核酸/RNA/其他RNA/长链非编码RNA
长链非编码RNA,也称为lncRNAs,在结构上类似于mRNAs。然而,lncRNAs的独特之处在于它们不参与任何蛋白质编码。化学探测和结构研究一直是了解几种IncRNAs结构的方法,包括核糖体结构[1]。其他适用于IncRNAs的研究是测量RNA二级结构的方法。此外,顾名思义,lncRNAs是哺乳动物基因组产生的长(或大)转录本。
在许多使当今能够深入研究RNA分子的技术进步之前,lncRNAs就被发现和表征了。最初,人们认为这些分子与其他RNA的功能类似,即编码蛋白质。然而,随后的实验数据表明,lncRNAs缺乏开放阅读框(ORF),这证明这些转录不可能编码蛋白质。
尽管已经确定lncRNAs不参与蛋白质合成,但这些转录的功能仍然是一个问题。虽然lncRNA机制的重大谜团仍然没有得到解答,但根据Moran、Perera和Khalil的文章,“过去几年中,大量出版物记录了lncRNAs的重要功能,影响了许多生物过程,包括基因表达调控、剂量补偿、基因组印记、核组织和区室化以及核质运输。”[1]
长链非编码RNA分为三类:内含子长链非编码RNA、天然反义转录本和长链间隔非编码RNA。尽管已确认人类和其他哺乳动物基因组会产生这些不同类型的lncRNAs,但尚未完全了解这些分子在生物过程中的作用,以及它们的作用机制。这些主题仍然是许多不同假设中争论的话题。
顾名思义,内含子长链非编码RNA(内含子lncRNAs)仅从蛋白质编码基因的内含子中表达。
天然反义转录本,缩写为NATs,是与蛋白质编码基因重叠并反向转录的转录本。这些分子是在21世纪初发现的,当时在小鼠中鉴定出超过11,000个lncRNAs。经过进一步检查,确定这些lncRNAs中相当一部分是NATs。Moran、Perera和Khalil写道,在另一项研究中发现,“人类细胞中40%的蛋白质编码基因也表达NATs。”[1] NATs在过去十年中一直被研究,研究表明NATs具有特定的功能:它们调节与它们重叠的蛋白质编码基因。
最近,lncRNAs在基因组的“基因间”区域表达,或是在DNA片段中几乎没有基因或根本没有基因。这些lncRNAs被命名为长链间隔非编码RNA,或lincRNAs。
在RNA测序技术出现之前,研究人员利用已知的事实,“积极转录的蛋白质编码基因通常显示特定的组蛋白修饰模式”,然后能够分离lincRNAs。这些结果表明,人类和老鼠基因组都创造了超过3300个lincRNAs。RNA测序技术证实了这些结果,发现了更多lincRNAs。目前,预计整个人的DNA会产生超过8000个lincRNA,其中超过一半被认为是“高置信度lincRNAs”。[1] 这些高置信度lincRNA位于细胞的各个区域,包括细胞核和细胞质,并且被认为可能在细胞身份中发挥作用。
尽管只有很小一部分lncRNAs通过实验进行了检查,但新兴的结果是,这些分子参与了许多生物学背景。
尽管基因调控通常由于其复杂性而需要许多不同的因素,但最近的研究表明lncRNAs通过各种机制促成基因调控。
一个已知且研究得很好的lncRNA叫做Xist,它是这些基因调控lncRNAs的例子。Xist负责启动和扩散女性体细胞中X染色体的失活。虽然Xist实现此功能的具体机制尚不清楚,但整个科学界都认为Xist是抑制失活X染色体上数百个基因所必需的。
lncRNAs参与调控基因表达的另一个过程称为基因组印记。基因组印记需要非常严格的调控,主要是因为印记基因的表达在哺乳动物发育中起着至关重要的作用,而印记基因两个等位基因的表达水平在不同基因之间可能存在很大差异。大量的lncRNAs,以及mRNAs,积极调节蛋白质编码基因的表达顺式。“Air”是这些基因表达调控lncRNAs之一,通过定位到染色质来沉默三个顺式印记基因。
基因也可以通过反式作用的 lncRNAs 调控。例如,一种叫做 HOTAIR 的 lncRNA(实际上是一种 lincRNA),可以反式调控人类 HOXD 基因的表达。
多能性是指干细胞分化为三胚层的能力:中胚层、内胚层和外胚层。
虽然之前的研究表明维持多能性需要关键的转录因子和染色质因子,但研究也发现一些转录因子与小鼠中许多 lincRNAs 的启动子结合。另一项研究也表明,维持多能性需要两种特定的 lincRNAs。
深入研究了 lincRNAs 在多能性维持中的作用,一项研究表明 26 种 lincRNAs 是维持多能性所必需的。这些 lincRNAs 被确定会导致“退出多能性状态或激活谱系承诺程序”。[1] lincRNAs 被认为是传感器,感知干细胞的环境并提醒干细胞保持多能性或根据环境变化进行改变。
基因表达调控发生在多个水平,例如转录之前、期间或之后,或在翻译期间。最近,被称为副斑点的核结构被认为是转录后基因调控的参与者。然而,副斑点被观察到是动态结构,在发育的某些阶段不存在。副斑点的出现与一种叫做 NEAT1 的富含核的常染色体转录本的激活相一致,这一事实支持了 NEAT1 是副斑点形成所必需的分子这一结论。此外,NEAT1 的消耗会导致随后副斑点在细胞核中的丢失;同样,NEAT1 的过表达会导致副斑点的增加。这些观察表明 NEAT1 在细胞核中副斑点形成和维持中起着至关重要的作用。
pre-mRNA 的选择性剪接会导致蛋白质组的复杂性,因为它从单个 mRNA 生成具有不同功能的多种蛋白质产物。一种叫做 MALAT1 的 lncRNA,即转移相关的肺腺癌转录本 1,被认为在 pre-mRNA 的选择性剪接中起着重要作用。这得到了 MALAT1 定位于核斑点的这一事实的支持,核斑点实际上包含几种与选择性剪接相关的蛋白质。特别地,MALAT1 调控参与 pre-mRNA 调控和剪接位点的特定蛋白质的磷酸化。此外,已经证明 MALAT1 的消耗会影响 pre-mRNA 选择性剪接的模式。然而,尽管发现了 MALAT1,但仍有待确定其他 lncRNAs 是否参与选择性剪接的调控。
尽管研究人员尚未发现有关 lncRNAs 作用机制的所有细节,但可以解释 lncRNAs 发挥作用的几种机制。
尽管染色质修饰复合物和 DNA 甲基转移酶通过酶促修饰染色质和 DNA 来激活和抑制基因,但这些酶如何在没有 DNA 结合能力的情况下识别其靶基因仍然是一个问题。最近有人提出,一些 lncRNAs 充当染色质修饰复合物和其他核蛋白的引导,将其引导到特定位置,以便这些分子发挥各自的作用。
lncRNAs HOTAIR 和 Air 都会靶向和引导染色质修饰复合物到其靶基因;这两种 lncRNA 之间的唯一区别在于 HOTAIR 反式结合,而 Air 顺式结合 (这与它们在“基因表达调控”部分提到的基因调控功能一致)。最近的证据表明,在这个过程中,lncRNA 首先与染色质结合,然后作为染色质修饰复合物的“对接站”。
尽管细胞中围绕 RNA 的大多数核糖核蛋白复合物 (RNP) 的具体分子组成尚未确定,但研究表明 lncRNAs 以 RNP 的形式存在于细胞中。例如,lncRNA Xist 已被证明与特定的转录因子相互作用,该转录因子有助于将 Xist 连接到失活染色体;Xist 形成某种分子桥,以连接这种转录因子和染色质修饰复合物,从而抑制失活染色体上的基因。
其他 lncRNAs,如 NEAT1 和 MALAT1,形成几种蛋白质的分子支架。通过这样做,它们可以调控这些蛋白质的功能。然而,目前尚不清楚这些 lncRNAs 如何识别其各自的蛋白质并开始在细胞核中形成这些分子支架。
已证明几种 lncRNAs 对细胞环境中的特定刺激作出反应。因此,它们被触发激活特定的转录程序,这些程序允许细胞对这些刺激作出反应。在某些情况下,lncRNAs 充当负调节因子。例如,lncRNA 生长停滞特异性 5 (GAS5) 充当糖皮质激素受体 (GR) 的负调节因子,GR 是特定类别的核受体。当被激活时,GAS5 与 GR 相互作用,抑制这类核受体与它们特定的 DNA 反应元件结合并执行其功能。因此,lncRNAs 充当转录因子可以导致基因表达变化的效果的调节剂,以及细胞对来自细胞环境的刺激作出反应的能力的调节剂。
尽管只有少数 lncRNAs 与人类疾病相关,但最近,在某些情况下,科学家观察到 lncRNAs 与人类疾病之间存在密切关联。根据 Moran、Perera 和 Khalil 的论文,“lncRNAs 被发现在一系列人类疾病和疾病中失调,包括各种类型的癌症”。[1] 尽管大多数 lncRNAs 的机制尚未完全被发现,但一些研究已经开始揭示少数 lncRNAs 的机制。在文章“长非编码RNA的基因组调控”中,Rinn 和 Chang 提到了人类癌症中 IncRNAs 的改变,“几十种 lncRNAs 被记录为在人类癌症中表达改变,并受特定致癌和肿瘤抑制途径的调控,例如 p53、MYC 和 NF-κB 最近描述了一类 IncRNAs,这些 IncRNAs 在人类细胞周期中显示周期性表达,而其中许多在人类癌症样本中表达失调。” [2] 癌症是研究最多的疾病,这使得 IncRNAs 可能参与许多其他疾病的发病机制。在未来的研究中,有必要研究不含蛋白质编码基因的区域中的潜在 IncRNA 转录本,因为这些区域与人类疾病密切相关。
Khalil,Ahmad M.,Victoria A. Moran,Ranjan J. Perera。"哺乳动物长链非编码 RNA 的新兴功能和机制范式。" http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3413108/。2012 年 4 月 5 日。
Rinn,John L. 和 Howard Y. Chang。"长链非编码 RNA 的基因组调控。"美国国家生物技术信息中心。美国国家医学图书馆,n.d. 网络。2012 年 12 月 7 日。