跳转到内容

结构生物化学/基因组分析

来自 Wikibooks,开放世界的开放书籍

基因组研究的目的是对人类基因组进行测序和分析。人类基因组由大约 30 亿个 DNA 碱基对组成,分布在 24 条染色体上。这给完整测序带来了困难。然而,通过组织学术实验室和私营公司的国际合作,人类基因组已从 2001 年首次报道的草图序列发展到 2004 年的完成序列。

人类基因组包含大量关于人类不同特征的信息,包括生物化学和进化。对人类基因组的分析将继续发展和扩展,以更好地了解人类。实现这一目标的首要任务之一是开发蛋白质编码基因的清单。基因组测序项目刚开始时,估计存在约 100,000 个基因。当完成但未完成的基因组首次公开时,这一估计值实际上下降到约 30,000 到 35,000 个基因。当序列完成时,它再次下降到 20,000 到 25,000。由于存在大量假基因,其中许多是以前的功能基因,已经发生突变并且不再表达,因此基因的估计值下降了 75%。超过一半的嗅觉受体基因组区域(负责人类嗅觉的分子)是假基因。然而,出人意料地少的基因数量仍然掩盖了人类蛋白质组的复杂性。许多基因通过诸如 mRNA 的可变剪接和蛋白质的翻译后修饰等机制编码不止一种蛋白质。单个基因编码的不同蛋白质显示出功能特性的重要差异。

人类基因组包含大量不参与蛋白质编码的 DNA。现代生物化学家和遗传研究人员正在努力阐明这种非编码 DNA 的作用,因为许多这种 DNA 的存在是由于移动遗传元件的存在。这些元件随着时间的推移插入到整个基因组中。然而,大多数这些元件都经历了突变,因此不再具有功能。人类基因组中存在超过 100 万个Alu序列,每个序列约包含 300 个碱基。Alu序列是短散布元件(SINEs)的例子。此外,人类基因组还包括近 100 万个长散布元件(LINEs),它们是长度为 10 千碱基对的 DNA 序列。这些元件作为中性寄生虫或基因组进化工具的作用仍在研究中。

基因的探索依赖于关键工具:1. 限制性内切酶分析 2. 印迹技术 3. DNA 测序 4. 核酸固相合成 5. 聚合酶链式反应

比较基因组学

[编辑 | 编辑源代码]

可以通过将人类基因组与其他生物的基因组进行比较来发现对人类基因组的见解。例如,黑猩猩(人类最接近的现存近亲)的基因组测序已接近完成。与其他用于生物研究的哺乳动物(如小鼠和大鼠)的基因组比较也已经完成。这些比较的结果表明,99% 的人类基因在这些啮齿动物基因组中都有对应基因。然而,自从人类和啮齿动物拥有共同祖先以来,估计在 7500 万年的进化过程中,这些基因在染色体之间发生了大量的重排。其他生物的基因组被专门用于比较基因组学。当将各种其他生物的基因组与人类基因组进行比较时,揭示了 1000 多个以前未被识别的基因。此外,比较基因组学是解释人类基因组以及理解属和物种起源中的重大事件的有力工具。

[编辑 | 编辑源代码]
华夏公益教科书