结构生物化学/生物信息学/结构比对
当序列比对结果显示相同氨基酸不到 25% 时,通常可以排除同源性。然而,即使序列没有显示出同源性,它们结构的比较也可能存在同源性。蛋白质的 **三维结构** 与其功能相比,与其一级序列更相关。因此,三级结构通常比序列更保守。尽管一个家族中的蛋白质在氨基酸序列上可能有所不同,但它们以相似的结构为特征。血红蛋白和肌红蛋白就是一个例子。虽然这两种蛋白质的序列不同,但它们都以相似的血红素基团为特征,该基团允许氧气的结合和转运。
蛋白质也可能存在结构相似性,但发挥不同的生化作用并具有不同的氨基酸序列。这表明存在一个 **共同祖先**,通过所谓的 **趋异进化** 演化为不同的途径。然后,这些蛋白质被认为是 **旁系同源物**,它们通常在一个物种内具有不同的功能。肌动蛋白和 Hsp-70 就是一个例子。虽然两者在结构上相似,但肌动蛋白在肌肉收缩和细胞运动中发挥作用,而 Hsp-70 在防止压力和热休克中发挥作用。另一个更简单的例子是我们手和青蛙腿之间的关系。相同的祖先和相同的起源,但发生了分化并具有不同的功能。
序列比对方法可用于检测同源性的相似性。可以通过将一个蛋白质序列滑动到另一个序列上并记录匹配残基的数量来比较两个蛋白质序列。
在分析相似结构后,可以重新评估序列比对以获得更好的匹配。可以插入 **间隙** 以弥补通过进化插入或删除的氨基酸,以获得结构相似的蛋白质之间更好的序列比对得分。尽管可以在蛋白质之间观察到整体序列差异,但同一家族中的蛋白质通常包含在功能中起关键作用的区域,因此这些区域更保守。由此,可以创建 **序列模板**,该模板映射出对结构和功能至关重要的保守氨基酸残基。评分方法包括对间隙进行罚分,以防止插入不合理的间隙数量。
通过使用替换矩阵,我们可以检测到遥远的进化关系。一些替换是结构保守的替换。它们具有相似的尺寸和化学性质。它们不会对蛋白质结构产生重大影响。其他替换是彼此不相似。在替换矩阵中,“较高的正分数对应于相对频繁发生的替换,而较高的负分数对应于很少发生的替换”(Berg 169)。
此外,我们可以使用数据库来识别进化关系。例如,美国国立生物技术信息中心 (www.ncbi.nih.gov)
在某些情况下,基因可能会被复制并在积累突变后发展成一个新基因。但是,由于新基因起源于原始基因,因此它仍然保留着相似的结构域。可以通过将蛋白质与其自身进行比对,通过重复序列的序列和结构比对来检测相似的结构域。
一些蛋白质可能具有相似的结构,但起源于不同的祖先。这被称为 **趋同进化**,其中不同的蛋白质通过不同的途径进化,并收敛于相似的结构和功能。在这种情况下,蛋白质在证明其功能重要的区域可能具有相似的结构/序列。这些蛋白质通常具有相似的结合位点/活性位点。由于整体结构的差异,同源性被排除在外。我们眼睛和苍蝇眼睛之间的趋同进化就是一个例子。苍蝇的眼睛起源于完全不同的起源,但与我们的眼睛具有相同的功能。
同源 RNA 序列的结构比对可以决定其结构。对 RNA 的比较可以作为研究进化关系的来源。虽然两个 RNA 链的碱基序列可能不同,但可以通过 **碱基配对的保守性** 获得相似的结构。虽然可能涉及不同的碱基,但碱基配对仍然发生在相同的一般位置,从而允许相似的二级结构。