结构生物化学/生物信息学/进化树
早期关于分支进化树或系统发育树的迹象是古生物学图表。这种图表在爱德华·希契科克的《基础地质学》一书中有所体现,展示了植物和动物之间地质关系。然而,追溯到更早的时代,树状生命的想法起源于古代关于生命从低级到高级形式阶梯式进化的概念。阶梯式进化的一个例子就是“存在大链”。
此外,一位名叫查尔斯·达尔文的知名人士在 19 世纪 50 年代在其具有开创性的著作《物种起源》中绘制了最早的进化树之一。基本上,在这本书中,他展示了进化树的重要性。许多年后,许多进化生物学家通过使用树状图来描述进化,来研究生命的形式。这样做的原因是,这些类型的图表被证明非常有效地解释了物种形成的概念,即谱系随机分裂和适应性概念。总的来说,几个世纪以来,许多生物学家使用进化树作为研究生命概念的一种工具。
进化树,或系统发育,是对生物体及其彼此之间的进化史进行的正式研究。系统发育树最常用于描述物种之间存在的相互关系。特别是,它们阐明了某些性状是同源的(由于趋异进化而出现在共同祖先中)还是同塑的(有时被称为类似性状,指在共同祖先中不存在但其功能在两个或多个生物体中独立发展起来的性状,被称为趋同进化)。进化树是显示各种生物物种及其进化关系的图表。它们由从低级生命形式流向高级生命形式的分支组成。
进化树与分类学不同。分类学是根据一组用来评估异同的特征,将生物体按顺序划分为类别,而进化树涉及生物分类,并使用形态学来显示关系。系统发育通过比较各种生物体中的 RNA、DNA 或蛋白质等聚合物分子所发现的关系,用进化史来展示。进化途径通过这些聚合物分子的序列相似性进行分析。这是基于这样的假设:序列的相似性是由于进化分化程度低于其他序列。进化树是通过对序列进行比对来构建的。分支的长度与序列之间氨基酸差异的数量成正比。
系统发育系统学根据共享的特征来告知系统发育树的构建。比较核酸或其他分子来推断关系是追踪生物体进化史的宝贵工具。分子树能够涵盖时间段的短长,这是由于基因即使在同一个进化谱系中,也能以不同的速率进化。例如,编码 rRNA 的 DNA 变化相对缓慢,因此对这些基因中 DNA 序列的比较对于调查很久以前分化的分类群之间的关系非常有用。有趣的是,人类和小鼠 99% 的基因在可检测到的是直系同源的,我们 50% 的基因与酵母的直系同源。人类和小鼠中的血红蛋白 B 基因是直系同源的。这些基因具有相似的功能,但自人类和小鼠拥有共同祖先以来,它们的序列发生了分化。
通过检查序列相似性,可以推断出蛋白质家族成员之间的进化途径。这种方法基于这样的概念:彼此更相似的序列比不太相似的序列具有更少的进化时间来分化。
如今,进化树用于 DNA 杂交。它们用于确定两个相似物种之间遗传物质的百分比差异。如果两个物种之间的 DNA 非常相似,那么这两个物种密切相关。如果只有很小的百分比相同,那么它们的关系就比较远。
进化树中每条线分支的点被称为节点。节点是分支上物种的共同祖先。进化树中物种之间的关系包括单系群、并系群和多系群。单系群是包含共同祖先及其所有后代的物种分支。并系群包含共同祖先,但不包含其所有后代。多系群包含没有(最近)共同祖先的生物体,通常用于研究相对无关生物体之间的相似特征。
这些节点是通过使用计算系统发育程序计算从多个序列比对得到的遗传距离来计算的。然而,也存在局限性,主要是不可能考虑实际的进化历史。虽然序列比对显示了两个物种之间的相对关系,但没有表明它们是如何进化的。因此,对于三域的起源,它们来自同一个祖先,然后分支到真核域和原核域这两个不同的群体。然而,古细菌从真核域分支出来,即使它们是单细胞生物。
系统发育构建的证据:1. 通过观察化石记录。问题是记录不完整,只有硬质结构被保存下来。2. 通过研究最近的物种,观察共享特征,包括同源特征和类似特征,可以证明进化史。
进化树有很多不同的类型,每种类型都代表着不同的东西。一种类型的进化树被称为有根系统发育树。这种树是一种直接类型的树,它包含一个特殊的节点,对应于树叶处所有实体的最近共同祖先。使用无可争议的外群是最常用的树根方法之一。换句话说,有根树通常说明特定外群的序列或性状数据。
另一种类型的进化树被称为无根树。无根树通常说明不同叶节点之间的关系。这是在不做出任何关于祖先的假设的情况下完成的。与有根树需要识别祖先迹象不同,无根树始终可以从有根树中创建,方法是省略根。基本上,无根树是通过对每个分支上的相对进化速率做出假设或将外群包含在输入数据中来生成的。在这种过程中经常使用的一种应用程序称为分子钟假说。
最后但并非最不重要,二叉树也是一种进化树。在二叉树中,有根和无根系统发育树都可以是多分叉的或二叉的,可以显示为标记的或未标记的。例如,一个多分叉的有根树可能在节点处具有两个以上的子节点,与无根多分叉树不同,在无根多分叉树中,节点处可能出现三个以上的邻居。
此外,一个已分叉的生根树恰好有两个后代从每个内部节点产生,通常形成二叉树。另一方面,一个非生根分叉树类似于一个非生根二叉树。一个非生根二叉树通常有一个自由树,在每个内部节点恰好有三个邻居。就标记树和未标记树而言,标记树在其叶子上有唯一的分配值,而未标记树(也称为树形)仅定义为拓扑结构。
总的来说,对于给定数量的叶节点,可能树的数量取决于所查看的特定树类型。然而,分叉树的数量总是少于多叉树的数量。类似地,未标记树的数量少于标记树的数量,非生根树的数量少于生根树的数量。就标记树而言,始终要注意字母“n”代表叶节点的数量。
可以通过确定不同生物体中相似基因的序列信息来构建进化树。彼此相似的序列通常被认为具有较少的差异时间。相反,较不相似的序列具有更多的进化时间来发生分化。进化树是通过比对序列并使每个分支长度与序列的氨基酸差异成正比来构建的。此外,通过为序列分配一个恒定的突变率并执行序列比对,可以计算出感兴趣序列何时分化为单系群的近似时间。
DNA可以通过PCR方法的开发进行扩增和测序。从尼安德特人化石中提取的线粒体DNA被鉴定含有379个碱基的序列。与智人相比,该序列中仅发现22到36个替换,而智人和黑猩猩在同一区域的共同碱基上则有55个差异。进一步的分析表明,智人和尼安德特人在60万年前有着共同的祖先。这表明尼安德特人不是黑猩猩和人类之间的中间物种,而是一个进化上的死胡同,已经灭绝了。
序列比对可以在各种序列上进行。例如,为了构建蛋白质的进化树,比对序列,然后通过相似性进行比较以构建树。在上面的珠蛋白树中,就可以看到哪个蛋白质首先分化。另一个典型的例子是使用rRNA(核糖体RNA)来比较生物体,因为rRNA的突变率较慢,是构建进化树的更好来源。
这是由卡尔·乌斯博士在20世纪70年代后期进行的研究所最好地支持的。由于核糖体对生物体如何运作至关重要,因此它们在进化过程中不容易发生改变。重大的变化可能导致核糖体无法发挥其作用,因此其基因序列得以保留。利用这一点,乌斯博士比较了大量细菌中核糖体序列的微小差异,并展示了它们并非全部相关。观察极端细菌,如产甲烷菌,无法将它们与真核生物或原生生物联系起来,因为它们属于它们自己的古菌类别。
构建系统发育树需要系统分类学家寻找突触形态(共享衍生特征)和同源形态(共享祖先特征)。
Three Domain 阅读系统发育树:图中的数字表示突触形态或共享衍生特征,这些特征仅对这些群体或群体是唯一的。图示表明存在三个域:细菌、古菌和真核生物。真核生物和古菌域具有(1)内含子、组蛋白和与真核生物RNA聚合酶相似的RNA聚合酶。此外,古菌域具有(2)膜中独特的脂质含量和独特的细胞壁组成。
真核生物域 Four supergroups phylogeny 真核生物的突触形态是(5)具有细胞核、膜结合的细胞器、膜中的固醇、细胞骨架、线性DNA(基因组由多个分子组成)以及9+2微管超微结构鞭毛。根据DNA序列数据,该域有四个超群:Excavata、Chromalveolata、Unikonta、Archaeplastida(红藻、绿藻、植物)。
Archaeplastida超群具有(7)通过初级内共生获得的叶绿体。主要支系:Rhodophyta(红藻)、Chlorophyta(绿藻)、Plantae(陆地植物)。 Archaeplastida phylogeny
Excavata超群: Excavata 该超群有三个门:Parabasalia、Euglenophyta和Kinetoplastida。Euglenophyta没有细胞壁,但具有(8)细胞膜内的柔性表皮。它具有与植物中相同的叶绿素A和B——它通过次级内共生(绿色谱系)获得的。Parabasalia具有(9)减少或消失的线粒体。Kinetoplastida具有(10)单一的巨大线粒体/动基体,它编辑mRNA。
Chromalveolata超群: Chromalveolata phylogeny 有三个支系:alveolata、straminopila和rhizaria。
Rhizaria的门有孔虫具有(11)由有机材料和CaCO3制成的多室壳。
straminopila和rhizaria的突触形态是(12)通过次级内共生(红色谱系)获得的叶绿体。
straminopila具有(13)两个大小不一的鞭毛,一个较长的纤毛状。straminopila有三个主要的门。硅藻门(硅藻)具有(14)有机基质中水合二氧化硅的细胞壁,由两半组成:“盒和盖”。褐藻门(褐藻)具有(16)多细胞海藻。卵菌门(水霉菌、霜霉菌)具有(15)叶绿体的缺失。
alveolata具有(17)质膜下方的膜结合囊。有三个门。甲藻门具有(19)纤维素状材料的板,有沟槽。纤毛虫门具有(20)两种功能上不同的核:大核(控制代谢)和小核(在有性生殖中起作用)。顶复门具有(18)用于穿透宿主细胞的顶端结构。
Unikonta超群具有(6)一个三嘧啶生物合成融合基因,并具有一個鞭毛
Unikonta phylogeny 三个主要支系:变形虫、真菌、动物。
变形虫具有(21)宽阔的伪足。它的裸变形虫门(22)通过叶状伪足进行摄食和移动。
后鞭毛生物(真菌和动物界)具有(23)后生鞭毛。真菌具有(24)由几丁质构成的细胞壁,吸收性异养,并且是多细胞的。真菌有四个门。除了壶菌门(水霉菌)之外,所有其他真菌门都具有(25)鞭毛的缺失以及质配和核配之间的时间间隔。接合菌门具有(26)有性生殖的异核状态仅限于接合孢子囊。担子菌门和子囊菌门都具有(27)分生孢子、广泛的(n+n)状态、大小和持续时间、隔膜菌丝以及肉眼可见的子实体。担子菌门具有(28)在双核状态下长寿的双核菌丝体,在称为担子的特殊细胞中产生减数孢子,并且以有性生殖为主(无性孢子很少见)。子囊菌门具有(29)在称为子囊的特殊细胞中产生的减数孢子。
动物界是(30)多细胞的,具有细胞外基质,其中含有胶原蛋白、蛋白多糖和细胞之间特殊类型的连接(细胞粘附蛋白)。
多孔动物门(海绵)具有(31)骨针、内部水管系统。真后生动物亚界具有(32)身体对称性、初级胚层(真正的内胚层和外胚层)、真正的组织和器官、上皮组织和神经组织。辐射对称动物具有(33)初级辐射对称。刺胞动物门具有(34)中胶层和刺细胞(具有刺丝囊)。两侧对称动物具有(35)两侧对称、体腔(体腔)、中胚层(三胚层)和肌肉。两个主要的系统发育分支是原口动物和后口动物。原口动物具有(36)裂体腔,原口发育成口。后口动物具有(37)肠体腔、不确定的细胞命运、放射状卵裂,原口发育成肛门。棘皮动物门具有(38)水管系统、管足,并且在成虫期具有辐射对称性(幼虫期为两侧对称)。半索动物具有(39)在生命中的某个阶段具有咽鳃裂。脊索动物具有(40)肌肉化的肛后尾、背侧神经索和脊索。
原口动物的系统发育树。 Protostomia phylogeny
脊索动物的系统发育树。 Chordata phylogeny
Waggoner. Ben. "Archaea: Systematics." 15 Nov. 2009. <http://www.ucmp.berkeley.edu/archaea/archaeasy.html> http://en.wikipedia.org/wiki/Phylogenetic_tree