跳转到内容

蛋白质组学/蛋白质组学与药物发现/软件工具

来自维基教科书,自由的教科书,开放的世界
Previous page
对接和评分
蛋白质组学与药物发现 Next page
蛋白质聚集
软件工具


本节


有用链接、资源和软件

[编辑 | 编辑源代码]

这些工具和数据库是公开资源的示例,可供药物发现团队使用。私有数据库通常也包含公开资源的内容。

蛋白质、蛋白质组学和药物发现资源

[编辑 | 编辑源代码]

数据库

  • NCBI[1] 美国国立生物技术信息中心拥有关于蛋白质结构和序列、核苷酸序列、数十种期刊等的数据库。
  • 蛋白质数据库 (PDB) [2] PDB 是生物大分子结构数据的存储库。

应用程序

  • ExPASy 蛋白质组学服务器 [3] 它包含许多用于蛋白质序列和结构分析的有用工具。

印刷/网络资源

  • Landes Bioscience 的药物设计 [4] NCBI 上的一本免费书籍,其中包含关于药物发现的良好信息。
  • 药物发现新闻 [5] 包含许多关于药物发现的最新新闻和趋势的免费文章。
  • 生物技术信息目录 [6] 这是一个基因组学、蛋白质组学和药物发现的链接列表。

虚拟药物和靶点库

[编辑 | 编辑源代码]

免费库

  • 人类代谢组数据库[7] HMD 是一个免费的数据库,其中包含略低于 2500 种代谢物,这些代谢物与超过 5500 种对应于它们的蛋白质和 DNA 序列相关联。
  • 美国国立癌症研究所 (NCI) 数据库 [搜索增强型 NCI 数据库浏览器] 这个公开数据库包含超过 250,000 种化合物,以及详细的搜索功能。
  • ZINC[8] ZINC 是加州大学旧金山分校的一个免费库,包含惊人的 460 万种可搜索化合物,这些化合物以多种格式提供,并提供供应商链接以供订购。

付费库

  • 可用化学品目录 (ACD) [9] ACD 是 Elsevier MDL 推出的专有化学数据库。它包含超过 480,000 种独特的化学化合物;多个学术机构可以订阅使用该数据库。
  • Quantum Lead 虚拟筛选服务 [10] 这个付费库包含 50,000 种化合物。该公司还提供其他化合物分析软件。
  • 治疗靶点数据库 (TTD) [11] TTD 包含有关已知治疗性蛋白质和核酸靶点的信息。此外,它描述了靶向疾病状态并提供通路信息。目前,TTD 包含 1535 个药物靶点和 2107 个药物/配体 (Chen)。

对接和评分工具

[编辑 | 编辑源代码]

对接问题中的搜索空间由所有可能的构象(分子 3D 结构中原子相对位置,与坐标系无关)和构型/取向(分子原子在经历坐标系中的旋转和平移后所处的位置,与配体配对的蛋白质)组成。在现有的计算资源下,不可能详尽地探索所有可能姿势的搜索空间(姿势是分子在坐标系中构象构型的名称)。不用说,每个对接模拟都是准确性和速度之间的权衡,一个好的对接工具预计在这两者之间保持合理的平衡。对接程序的成功可以说取决于两个因素:评分函数和搜索算法。

  • 评分函数将正确(实验验证)的对接姿势与不正确的姿势区分开来。它估计配体与受体之间的结合亲和力。
  • 搜索算法根据评分函数找到最佳的对接姿势。

有许多竞争性的对接工具可供使用,来源广泛,从昂贵的、功能丰富的企业套件到由学术/研究机构开发的简单但功能强大的应用程序。

DOCK 是由 Irwin Kuntz 领导的团队在加州大学旧金山分校开发的 (http://dock.compbio.ucsf.edu/)。最新版本 DOCK 6; 用 C++ 编写,并在功能上分为独立的组件,从而赋予程序灵活性。Kuntz 实验室为所有程序提供源代码,这些代码可供学术机构免费使用,但工业组织需要支付许可费。以下是作者为 DOCK 引用的部分应用程序:

  • 预测小分子-蛋白质复合物的结合模式
  • 搜索配体数据库,寻找抑制酶活性的化合物
  • 搜索配体数据库,寻找与特定蛋白质结合的化合物

DOCK 的主要可执行文件是从标准 unix shell 中的命令行运行的,Windows 用户需要使用类似 Linux 的环境(如 Cygwin)来运行它。DOCK 使用“增量构建”对接算法,这实际上意味着配体最初被“片段化”。

  • 选择一个基础的“锚点”。
  • 将锚点片段放置/锚定到活性位点。
  • 然后逐步添加其他片段。

蛋白质的活性位点由程序 sphgen 识别,该程序还生成填充位点的球体中心。得分网格由程序 grid 生成。程序 DOCK 然后将球体与配体原子匹配,并使用得分网格来评估配体取向,最后根据能量得分进行最小化。DOCK 6 和对接过程的一般综合教程可在此处找到:http://www2.umdnj.edu/~kholodvl/tut/DOCK60_intro_linux.pdf

Glide 是 Schrödinger (http://www.schrodinger.com/) 推出的商业产品,被宣传为“配体-受体对接的完整解决方案”。该工具的一些亮点包括:

  • 一系列速度与准确性的选择,从用于数百万种化合物的 HTVS(高通量虚拟筛选)模式,到 SP(标准精度)模式,到具有高级评分的 XP(额外精度)模式。
  • 用户友好界面:Glide 自动执行大型化合物库的计算,并以摘要和详细报告两种形式组织对接结果。“Maestro”用户界面提供高级可视化和分析工具来检查配体-受体相互作用。
  • 跨平台(Linux、SGI 和 IBM/AIX)和并行处理支持。

Glide 使用“随机搜索”对接算法。该算法近似于对受体位点中配体位置、取向和构象进行完整的系统搜索。能量最小化阶段利用蒙特卡罗模拟算法。

然而,Glide 的增强功能和易于使用的界面是有代价的,既有经济上的,也有计算上的。

Yucca 是一种专为小分子对接而设计的全新算法,由弗吉尼亚理工大学计算机科学系的 Vicky Choi 开发。该算法 (仍在积极开发中) 基于高效的局部搜索启发式算法,并与构象生成器 OMEGA (Optimized Molecular Ensemble Generation Application) 结合使用,生成了一组低能量构象。Yucca 利用“多构象”算法。从 OMEGA 获得的构象随后被刚性对接,并对构型进行粗略采样。然后对每个构型进行局部优化,以达到局部最小值。

与其他现有算法相比,Yucca 的评估结果表明它是一种具有竞争力的工具,但它仍在不断开发和改进,以添加和改进功能。正在进行的改进包括:该工具自己的构象生成器、更好的评分函数、灵活受体对接和虚拟筛选。


其他可用的软件工具包括

蛋白质-配体结合亲和力预测服务器是一个工具,可用于计算非金属蛋白质-配体复合物的结合能。

AutoDOCK 与 DOCK 一样,试图确定化合物在药物靶标中的方向。AutoDOCK 作为一个对接和评分包,也包含评分函数。AutoDOCK 也已应用于蛋白质-蛋白质对接问题。

  • 使用 HyperChem 进行对接研究 [14]

一个声称使用新型对接算法的新系统。

FleXX 是另一个广泛使用的对接程序,以其速度著称,相比之下,许多其他应用程序的运行速度都比较慢。

  • 分子对接服务器 [16]

分子对接服务器是一个互联网服务,可以计算小分子与蛋白质相互作用的位点、几何形状和能量。

ZLAB 在学术界是免费的,但商业上需要通过 Accelrys 购买付费许可证。它是一个两阶段的对接系统,ZLAB 执行初始 FT 计算,而 RLAB 优化最高得分的结果。

有关其他软件的链接,请参阅 维基百科分子对接 [18] 站点。

虽然目前有很多应用程序可以模拟分子间相互作用,但仍有很大的改进空间。新的应用程序和算法正在不断开发,在准确性和速度之间取得完美平衡的斗争仍然是关键因素之一。例如,Glide 尽管在准确性和易用性方面都是最佳表现者之一,但在计算时间方面却损失惨重。DOCK 和 AutoDock 等机构设计的软件包也有其优势,因为它们一直在不断改进和更新。但是,大多数此类学术软件都是基于命令行的,对于大多数用户来说学习曲线非常陡峭。灵活受体对接 (目前计算量非常大) 等其他各种问题仍然是活跃的研究领域。

参考文献

[edit | edit source]

Choi, Vicky. “Yucca: An Efficient Algorithm for Small-Molecule Docking."[19] 化学与生物多样性 2 (2005): 1517-1524。

Flower, Darren. "分子信息学:锐化药物设计的尖端"[20]。无出版商:英国皇家化学会,2002 年。

Kellenberger, E 等。“对八种对接工具进行对接和虚拟筛选准确性的比较评估。”蛋白质 57.2 (2004): 225-242。

Kuntz, Irwin 等。“DOCK 6.0 用户手册。”加州大学旧金山分校 DOCK 官方网站。2006 年 7 月。2006 年 11 月 12 日 http://dock.compbio.ucsf.edu/DOCK_6/dock6_manual.htm>。

Perun, Thomas J 和 C L Propst。 “计算机辅助药物设计”。无出版商:Marcel Dekker, Inc,1989 年。

Schrödinger。“Glide 4.0 用户手册。”Biowulf。2006 年 4 月。Schrödinger。2006 年 11 月 12 日。


下一章: 贡献者

华夏公益教科书