结构生物化学/生物信息学/蛋白质折叠识别

概述

生物信息学中最大的问题之一是氨基酸序列、结构和蛋白质功能之间的关系。蛋白质的三维结构有助于药物的开发、酶的工程化和蛋白质功能的分析。

结构空间及其与蛋白质同源性之间的关系存在着争议。然而，三级结构的预测依赖于主观片段的重复使用，而无需同源序列（目标序列和片段来源之间）。

GenTHREADER是生物学家和研究人员用来预测蛋白质三级结构的众多方法之一。这种方法有助于检测蛋白质模板和序列-结构比对的准确性。大多数用于折叠预测的方法使用已知的蛋白质结构作为计算蛋白质序列谱之间比对评分的基础。GenTHREADER 的两个版本是 pGenTHREADER 和 pDomTHREADER 方法，它们用于识别和比对蛋白质序列，以分析它们与蛋白质结构和功能的关系。这两个版本都具有类似的蛋白质序列谱和结构信息的输入；它们使用一个核心比对算法。

pGenTHREADER 使用从序列、卷曲螺旋区域和过滤的跨膜片段构建的矩阵进行谱-谱比较。最后一步包括两个序列-谱和谱-序列分数，这使得谱-谱匹配的分数高于其他匹配。此外，添加了一个疏水埋藏项，其作用是偏置比对在目标序列中的位置。

在确定结果时，使用模板-目标对的最佳结果来计算等效残基数，而不是使用该方法的结果；这将比对准确性与模板选择区分开来。选择最佳结果显着提高了小于 200 个氨基酸的链的性能，但在更长的链中几乎没有改进。当折叠识别关系更远时，pGenTHREADER 的效果明显优于其他方法；当距离更近时，其他方法往往显示出更大的改进。这些其他方法使用了折叠识别、侧链优化和模型质量评估的混合方法。