结构生物化学/生物信息学/比较生物信息学
如今,已经测序了大量的基因组。令人惊叹的是,其他物种的基因组与人类基因组非常相似。例如,果蝇(果蝇)中超过一半的基因具有与人类对应的基因,即使该物种在外观上完全不像“人类”。当科学家将人类的基因与哺乳动物的基因进行比较时,结果甚至更加令人震惊。
关于不同基因组的信息需要科学领域有一个新的领域:比较基因组学。比较基因组学研究不同物种基因组之间的关系,并试图发现更多基因组。此外,该领域还试图回答许多进化问题。最近,我们最亲近的现存亲属——黑猩猩的基因组草图已经完成。通过比较黑猩猩和人类的基因组,科学家或许能够找到我们从黑猩猩进化到人类的生物学方面的原因。
示例:果蝇 - 基因组
比较基因组学通过将不同生物体的序列 [1] 进行比对来识别在长距离和短距离上都起作用的模式。例如,将小鼠染色体与人类染色体进行比对表明,我们 99% 的蛋白质编码基因与小鼠中的同源序列进行比对。这种分析的基础是,高度保守的 DNA 序列很可能在功能上很重要。一个普遍的假设是,在比对中添加更多比较基因组有助于区分功能上重要的保守序列和无关的保守序列。
如果目标基因组尚未测序,则从头开始对物种的基因组进行完整测序,然后将其与其他基因组进行比较将花费很长时间。然而,科学可以利用其相关物种更快、更容易地完成这项任务。为了比较未测序的基因组,基因组学利用共享同线性,即相关物种染色体上 DNA 的保守排列。以小麦为例,小麦的基因组甚至比人类还要多;因此,对其进行测序将过于繁重。
1. 帮助我们了解动物和人类疾病的遗传基础。
2. 扩展我们对相关物种进化途径的基本认识。
3. 有助于寻找新的医疗方法和其他有益于人类健康的方法。
4. 确定人类基因的功能→例如,研究人员可以寻找人类在其他动物中的基因,这些基因的功能是已知的。如果科学家在另一种动物中识别出一个特定基因并知道它的功能,那么人类中具有相似序列的基因可能具有与动物中相似的功能。这被称为“注释”——定义为创建一组注释、标记和参考资料,描述关于基因或蛋白质的实验和推断信息。
1. 叶绿体基因组和线粒体基因组——叶绿体和线粒体也包含大量用于细胞的遗传信息。因此,在基因组学研究中也应考虑这一点。叶绿体是植物中进行光合作用的细胞器。然而,它也拥有自己的基因组,因此可以在复制过程中独立于细胞。与细胞核中的 DNA 相比,叶绿体中的 DNA 不会进化或进化速度极其缓慢。此外,由于重组不会发生,因此这种 DNA 也不可能在代代相传过程中被修改或突变。因此,科学家可以很容易地提供有关进化的详细信息。研究发现,叶绿体和细胞核之间发生了基因交换。一些蛋白质也来自叶绿体基因组。与叶绿体基因组类似,线粒体基因组不会随着时间的推移而发生显著变化。细胞中的线粒体是由细胞核和线粒体 DNA 共同制造的。这表明了两个基因组之间,即细胞核和线粒体的相互作用。
2. 果蝇——尽管果蝇的基因组比人类基因组小 25 倍,但果蝇的许多基因与人类的基因相似,并控制着相同的生物学功能。对果蝇的研究导致了对基因对疾病、动物发育、群体遗传学、细胞生物学、神经生物学、行为、生理学和进化影响的发现。
它们也用于帕金森病研究。研究人员发现,三分之二与癌症有关的人类基因在果蝇中都有对应基因。当科学家将与帕金森病相关的人类基因植入果蝇时,果蝇表现出人类相同的症状。这可能意味着它们可以作为寻找帕金森病疗法的全新模型。
如果不知道生物体的类型,则 DNA 作为 ID 工具。获取想要测序的物种 DNA,然后首先查看 Genbank——这是 DNA 的公共数据库,看看它之前是否有序列,因为这是公共知识。它也是某种分类浏览器。例如,如果要对海马进行测序,以查看水族馆中的特定物种是否为特定物种,那么可用的序列是细胞色素 B 序列。只需要对基因组中的细胞色素区域进行测序。为了做到这一点,必须扩增该区域——目的是为了复制该区域数百万次。获取与该区域互补的引物,并且已经对该区域进行测序的人员已经指定了可用于确定序列的引物。所有类型的引物都可以使用,即使是最近死亡的引物,只要没有气味。获取测序的 DNA,然后将其与库中的 DNA 进行比较。输入测序结果,并要求搜索引擎寻找最佳匹配。结果将显示与测序结果最相似的物种,并给出最佳匹配。
生物体 | 估计基因组大小 (MB) | 估计基因数量 | 测序年份 |
---|---|---|---|
人类 | 2,900 | 20,000-25,000 | 2001 |
小鼠 | 2,600 | 30,000 | 2002 |
河豚 | 365 | 33,609 | 2002 |
大鼠 | 2,750 | 20,973 | 2004 |
黑猩猩 | 3,100 | 20,000-25,000 | 2005 |
红原鸡 | 1,000 | 20,000-23,000 | 2004 |
果蝇 | 137 | 13,600 | 2000 |
蚊子 | 278 | 46,000-56,000 | 2002 |
裂殖酵母 | 13.8 | 4,824 | 2002 |
酿酒酵母 | 12.7 | 5,805 | 1997 |
原生生物 | 23 | 5,300 | 2002 |
拟南芥 | 125 | 25,498 | 2000 |
水稻 | 430 | 41,000 | 2002 |
- (参考:生物学,第八版,Raven 和 Johnson 著)
人类基因组与其他物种基因组的比较
1. 人类与河豚:河豚是第一个与人类进行序列比较的脊椎动物。人类和河豚的最新共同祖先是在 4.5 亿年前。然而,它们的基因组仍然存在许多相似之处。只有大约四分之一的人类基因在河豚中没有对应基因。然而,97% 的人类 DNA 是重复的,而在河豚中,这个数字只有大约 17%。
2. 人类与小鼠:这是首次对两种哺乳动物进行基因组比较。相似性更加显著。人类和小鼠都有大约 25000 个基因;令人惊讶的是,它们共享 99% 的基因组。人类和小鼠在大约 7500 万年前拥有相同的祖先,这比人类-河豚的祖先要短得多。然而,研究发现,小鼠 DNA 的突变速度是人类 DNA 的两倍。这使得两种生物体拥有 300 个独特的基因(仅占 1%);人类基因组比小鼠基因组多 4 亿个核苷酸。
3. 人类与黑猩猩:黑猩猩是人类最亲近的亲属之一。我们在大约 3500 万年前拥有共同的祖先。2005 年,黑猩猩的基因组被完全测序,并与人类的基因组进行比较。只检测到 1.06% 的替换差异和 1.5% 的插入和缺失差异。这些插入和缺失可能为我们提供了与黑猩猩不同的特征,包括缺乏体毛和更大的头骨。
4. 人类与植物:估计植物中有三分之一的基因在哺乳动物中没有发现。这些基因编码了植物的独特特征,例如光合作用和光合作用解剖结构。另外三分之二与人类和动物的基因组非常相似。这些相似基因编码了基本代谢、基因组复制和修复、RNA 转录和蛋白质合成。