蛋白质组学/蛋白质组学与药物发现/对接与评分
章节编辑和更新:Vishal Thovarai & Kevin Smith
电子邮件: [email protected]
本节
在进行蛋白质研究以及创建虚拟库或决定使用特定现有库之后,此类药物发现的下一步是对接和评分。在对接过程中,各种算法将虚拟库中的化合物与特定蛋白质上的指定靶点或靶点进行匹配。此阶段中使用的算法通常使用蒙特卡罗方法、遗传算法或增量构建,这些将在本节后面详细介绍。
对接化合物后,将对其进行评分。评分考虑了配体与靶点之间的化学相互作用,以确定复合物的能量状态并对所评分化合物的功效进行排名。
然后,在进行实际实验室实验以验证和确定药物先导的功效和毒性之前,将对得分最高的化合物在预测的对接方向上进行视觉检查,以验证计算出的稳定性。
分子对接的目的是确定两种分子物种之间的结合相互作用,在本例中,可以是蛋白质与蛋白质之间的相互作用,也可以是蛋白质与配体之间的相互作用。当然,为了能够模拟分子的行为,必须已经知道表示该分子及其相应特性的数据。因此,这种类型的行为推断被称为回顾性虚拟筛选 (Paetz)。从计算的角度来看,这在现代是通过模拟分子建模软件或算法来实现的。然后,模型分析大量可能出现的构象,以评估那些在能量上似乎更有利的构象。为此使用的主要算法使用蒙特卡罗方法、遗传算法或增量构建。
蒙特卡罗方法算法可用于帮助预测物理系统的行为。使用伪随机数生成来为计算提供支持,从而产生许多配体在结合位点上的随机构象和构型,试图“随机”地找到最佳匹配。鉴于可能的相互作用的复杂性和数量巨大,这种类型的算法非常适合用于模拟分子相互作用的应用。
遗传算法将配体不同的状态视为种群中的成员。这些成员会交配和突变,每一代的最佳匹配成员会被带到下一代。在寻求最佳匹配的过程中,模拟进化以在每一代产生越来越好的匹配。突变和有害事件用于避免局部最大值,这会让人误以为正在朝着一个“局部”最佳匹配的方向努力,尽管它可能不是绝对最佳匹配。
增量构建将配体视为片段,这些片段可以是刚性的,也可以是柔性的,具体取决于已知的立体化学原理。刚性部分首先放置在目标位点的理想位置,然后放置柔性部分。最后添加柔性部分的目的是能够完全且适当地连接所有刚性片段。增量构建的版本类似于团搜索。在这种方法中,根据特定特征(例如形成氢键的能力或官能团和侧链之间的静电相互作用)选择和定位刚性片段(Krovat)。
需要决定的一项主要因素是配体、蛋白质或两者是否将被视为刚性或柔性。当配体被视为柔性而蛋白质被视为刚性时,计算时间已经很长。这种在初始筛选中经常出现的场景的原因是:a) 由于化合物尺寸较小,配体的柔性更容易模拟;b) 配体的柔性会导致更广泛的化合物适合特定构象,因此,在合成或获取成本低廉且易于合成的化学物质方面,有一组备选方案可供选择。虚拟库中的许多化学物质实际上并不存在,或者很难获得,因此,在多个良好匹配中进行选择这一要素对于使 VLS 成为传统实验室筛选的更廉价替代方案至关重要。
将蛋白质视为柔性会大大增加对接的计算时间,因为需要考虑大量构象变化,但是,当蛋白质在体内是柔性时,这可以使对接更加准确,尤其是在以诱导契合蛋白质为目标时。某些当蛋白质被认为是刚性时,不一定是最佳匹配的配体,当允许蛋白质是柔性时,其排名可能会高得多。对于蛋白质柔性,有一些替代方案可以降低计算时间。一种方法是在对接过程中使用与已知配体结合的蛋白质的X 射线晶体学或NMR结构。这允许将虚拟库对接到处于配体结合构象的蛋白质中。另一种方法是使用多个具有略微不同构象的蛋白质结构,这通常是在 NMR 结构测定过程中实现的。这组结构,即系综,用于对接以找到在多个构象模型中适当地对接的化学匹配;目标是找到一种在蛋白质从未结合构象到蛋白质-配体构象的转变过程中,可以保持对接的先导。
两种常用的方法是表面互补性和基于模拟的方法。表面互补性方法使用傅里叶变换或快速傅里叶变换等技术将受体和配体的结构信息转换为数学网格,然后检查结构之间的互补性。模拟退火和禁忌搜索等模拟算法通常使用能量计算来执行模拟,如后面所述。
模拟退火是一种概率型元算法,它有许多应用,其中之一是分子对接。该算法在优化函数时会创建一个良好的近似值。它通过获取函数 E(s) 中的点s 并最小化能量来实现这一点,在分子对接中,这将导致蛋白质相互作用的优化。它通过运行一系列计算来实现,从s 的原始状态移动到s’ 状态,s’ 是一个任意数字。这被称为转换。转换通过接受概率函数 n P(e,e',T) 来显示,该函数取决于两种状态的能量和温度。在函数 P 中,e 是能量,e’ 是算法要移动到的能量状态,T 是温度。接受概率函数是有益的,因为当温度值非常小时,计算将移动到更低能量级的值。概率函数的要求是,每次移动都必须是非零的。1 模拟退火的另一个方面是退火计划。在此阶段,随着模拟的进行,温度会缓慢降低。模拟退火中使用的参数是状态空间、能量函数、候选生成过程邻域、接受概率函数以及退火计划。1 模拟退火过程流程图
禁忌搜索是另一种类型的算法。这里不同的是,它具有一个内存结构,并且不会尝试计算一个可能性超过两次。它可用于组合优化问题,其中目标是找到可能的最佳解决方案。它使用局部搜索过程从一个解决方案移动到下一个解决方案。禁忌搜索算法中的 N*(x) 函数被设置为记忆它已经尝试过的最后几个可能性 (n),因此不会重复计算。2 这使得它比其他算法更高效 (Hou)。
由于对接和评分算法的巨大计算需求,许多此类应用程序都是使用并行编程范式开发的,因此它们可以在多个 CPU 的集群上运行,并大大加快速度。 网格计算,一个快速发展的并行计算领域,目前正在作为专用 计算集群 的替代方案进行研究。网格计算模拟了电力公用事业网格,将允许制药公司所有闲置的计算机用于分布式计算网格。特别是在晚上,数百甚至数千台闲置的工作站可以与专用集群相媲美,而且成本只是其一小部分。然而,权衡取舍是网格计算缺乏按需保证可用性。
评分在虚拟药物发现中紧随对接,评估配体-蛋白质复合物的结合强度和能量状态。评分可以使用不同程度的严格性。最基本的评分函数考虑 氢键形成、范德华相互作用和其他静电作用力。更高级的评分函数除了考虑上述力之外,还考虑溶液的 介电常数,以及各种化学能模型(Anderson)。更基本的评分通常在初始筛选过程中完成,随着评分复杂性的提高,迭代地使用以缩小高评分药物先导的范围。
另一种旨在对非金属蛋白与配体相互作用进行“评分”的方法基于对相关分子(s)的特定原子特征的全面分析。在考虑上述一些更基本标准(如范德华力和静电相互作用)的同时,还根据疏水性以及结合状态下的自由能变化(Jain)指定了经验得分。到目前为止,该协议在快速计算和准确性方面已显示出很大的希望,并且可以在互联网上以蛋白质-配体结合亲和力预测服务器(BAPPL)的名义获得 [1]。
评分的第二阶段涉及视觉评估得分最高的匹配,以验证预测的结合潜力。在最终审查步骤中,会考虑构象、键的排列以及相互作用表面的形状。此外,先导物的尺寸和可用性/可生产性也包括在评估步骤中。一种易于合成但效果略差的化合物,可能比一种得分更高的配体更便宜、更值得进一步研究,而这种配体在虚拟库之外并不存在。
在对接中需要注意的首要问题之一是蛋白质结构的分辨率,以及组成蛋白质的原子的温度。温度是指结构测定阶段由于共振和振动导致原子三维坐标的不确定程度。这种振动存在于所有原子中;然而,振动越大,温度越高,因此原子的确定坐标变得越不可靠和不准确(Krovat)。
对接中的另一个问题是蛋白质的生理 pH 与蛋白质结晶时的 pH 值。这是确定潜在氢键位点的主要因素。许多氨基酸侧链的质子化和去质子化随着 pH 值的变化可能意味着紧密结合的配体和根本不结合的配体之间的区别,即使前者可能是假阳性,而后者则是假阴性。还必须考虑氢键的上下文,因为它们可以占据一系列结合强度。此因素也会影响评分。
其他问题包括在宽而浅的位点结合,因为由于缺乏可能相互作用的特定形状,表面几何形状的作用较小。此外,在体外可能存在的非典型结合模式可能在计算机模拟对接过程中无法检测到(Krovat)。
由于难以解析膜结合蛋白,因此在这些情况下对接中使用 同源建模,或者从一级序列推断的分子结构的阐明;这除了用于确定膜蛋白结构的同源建模之外。
BAPPL 链接:[2]
Bleicher,H. Konrad 等人。命中和先导物生成:超越高通量筛选。自然评论,药物发现。2003 年 5 月:(2),369-378。
Hou,T.,Wang,J.,XU,X.,“三种用于分子对接的启发式算法的比较”。中国化学快报 10 (1999): 615-618
Jain,Tarum,Jayaram,B. 一种基于全原子能量的计算协议,用于预测蛋白质-配体复合物的结合亲和力。FEBS Letters。2005:(579),6659-6666。
Kapetanovic,M. I. 计算机辅助药物发现与开发 (CADDD):计算机模拟-化学-生物学方法。化学生物学国际。2007 年。
Lengauer,Thomas 等人。新技术虚拟筛选。药物发现今日。2004 年 1 月:(9)1,27-34。
Meek,J. Peter 等人。形状特征;加速计算机辅助药物发现。药物发现今日。2006 年 10 月:(11)19-20,895-904。
Paetz,Jurgen,Schneider,Gisbert。一种用于分子生物信息学中的虚拟筛选的神经模糊方法。模糊集和系统。2005:(152),67-82。
Krovat,m. Eva,Langer,Thierry。评分函数对基于对接的虚拟筛选中富集的影响:对肾素抑制剂的应用研究。J. 化学。信息。计算。科学。2004 年 4 月:(3)44,1123-1129。
下一步:软件工具