化学信息来源/SIRCh/网络化学数据库

SIRCh：化学精选网络资源

字母顺序列表

内容
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

待办事项
本节目前正在修订。

A

美国矿物学家晶体结构数据库

包含发表在《美国矿物学家》、《加拿大矿物学家》、《欧洲矿物学杂志》和《矿物的物理与化学》上的所有结构，以及其他期刊中选定的数据集。该数据库由美国矿物学会和加拿大矿物学会管理，并由美国国家科学基金会提供资金。

用于电子结构计算的原子参考数据

包含氢到铀的原子的总能量和轨道特征值，这些数据是在密度泛函理论的几种标准变体中计算出来的。

Aureus Sciences 数据库 (Aureus Sciences)

Aureus Sciences 帮助研究人员将数据转化为知识，以加速药物发现过程。AurSTORE 是一个全面的数据结构化系统，特别适合集成客户自身研究计划中产生的专有生物和化学信息。数据库涵盖 ADME、激酶、核受体、蛋白酶、离子通道和 GPCR。

顶部

B

BiGG (加州大学圣地亚哥分校)

BiGG 数据库允许探索数百种涉及代谢的人类疾病。它包含超过 3,300 种已知的人类生化反应，并允许科学家在计算机中创建任何细胞。

Binding MOAD (密歇根大学)

Binding MOAD 的目标是成为最大型的、具有明确识别的生物相关配体且注释有从文献中提取的实验确定的结合数据（Kd、Ka、Ki、IC50）的良好解析蛋白晶体结构集合。目前有 9836 个条目，其中 2950 个条目包含结合数据。

BindingDB (马里兰大学生物技术研究所)

Binding Database 旨在通过 WWW 使溶液中分子非共价缔合的实验数据可搜索。最初的重点是生物分子系统，但宿主-客体和超分子系统的相关数据也很重要，并将在适当的时候纳入。该数据库目前包含通过等温滴定量热法 (ITC) 和酶抑制 (Enz. Inhib.) 方法生成的数据。BindingDB 包含 15,000 种小分子配体，这些配体对 PDB 中代表的蛋白质有 30,000 种已测量的亲和力。

C@ROL 下的生化途径数据库 (BioPath) (埃尔兰根大学)

BioPath 旨在帮助科学家了解基因调控对生物系统的影响，以进行药物靶点识别，并提供以下功能

1,175 种包含立体化学信息的连接表分子
1,545 种生化反应化学计量平衡，带有标记的反应中心和反应物和产物之间的原子-原子映射编号
1,000 种由名称和 EC 号表示的独特酶
202 种由名称表示的途径
涵盖生物体：原核生物、植物、酵母和动物，一般途径
途径的亚细胞定位

BioGRID

一个免费获取的蛋白质和遗传相互作用数据库。来自酿酒酵母、秀丽隐杆线虫、果蝇和智人的超过 116,000 种相互作用。通过对酿酒酵母初级文献进行详尽的整理，最近添加了 5,778 篇出版物的超过 30,000 种相互作用。内部超链接的 Web 界面允许快速搜索和检索相互作用数据。完整数据集或用户定义的数据集可以免费下载为制表符分隔的文本文件和 PSI-MI XML。各种文件格式的相互作用的预先计算的图形布局可用。使用称为 Osprey 的可视化系统可以构建包含嵌入式蛋白质、基因和相互作用属性的自定义图形，该系统与 BioGRID 动态链接。

生物大分子结晶数据库，BMCD

包含从文献中收集的晶体数据和结晶条件。BMCD 的当前版本包括 5247 个来自已获得衍射级晶体的生物大分子的晶体条目。这些包括蛋白质、蛋白质:蛋白质复合物、核酸、核酸:核酸复合物、蛋白质:核酸复合物和病毒。

生物磁共振数据库，BioMagResBank，BMRB

BMRB 是一个存储蛋白质、肽和核酸的 NMR 光谱数据的仓库。它包含许多指向有关 NMR 和生物分子结构的 www 资源的链接。

BioMeta 数据库 (CMBI)

BioMeta 是一个代谢物和代谢反应数据库。其内容主要基于 KEGG Ligand 数据库。与 KEGG 数据库相比，大量化学结构在组成和立体化学方面得到了修正。目标是创建一个包含正确分子和反应表示的数据库。大约 1,500 种分子结构已被修正，约 55% 的不平衡反应已被“平衡”。目前（2007 年 5 月 7 日），BioMeta 数据库的内容基于 KEGG Ligand 数据库的第 36 版（2005 年 10 月 25 日），但正在进行更新。

BioMOBY

MOBY-S 系统定义了一种基于本体的消息传递标准，通过该标准，客户端将能够自动发现并与适合任务的生物数据和分析服务提供者进行交互，而无需在数据从一个提供者流向另一个提供者时手动操作数据格式。

Biopath.Explore

BioPath.Explore 提供了一种方便的电子方式来访问存储在 BioPath 数据库中的所有信息，可以通过多种标准搜索方法和检索技术来访问这些信息。其他信息，例如计算的物理化学性质和 3D 分子模型，允许 BioPath 更广泛的应用。

美国和欧洲市场上的生物制药产品

数据库搜索功能包括产品/活性成分、产品类别、销售额、市场营销和批准状态、适应症/疾病、来源/宿主/表达和化学品（非活性）等。

生物物理化学数据库 (威斯康星大学)

数据库涵盖结构（蛋白质、核酸和病毒）和物理性质。还包括预测和可视化工具。

BioPrint (Cerep)

Cerep 的 BioPrint 为支持药物发现提供了一种独特的资源。BioPrint 将新药物候选物置于所有已上市药物的背景中，预测潜在的体内负面影响，预测脱靶活性，并预测 ADME 特性。Cerep 已系统地分析了超过 2,500 种已上市药物、失效药物和参考化合物的活性成分，在超过 180 种经过充分表征的体外分析中，包括多种分子靶点（GPCR 和其他受体、离子通道和转运蛋白、酶、激酶等），以及溶液性质和体外 ADMET 特性

BOND 生物分子对象网络数据库

BOND 是生物分子对象网络数据库——一个功能强大的新数据库，它结合了序列、相互作用和相关互作组数据和内容。BOND 包含 Genbank 和 BIND 数据以及相关工具和信息。BOND 将各种数据孤岛整合到一个资源中。BIND 现在是 BOND 的组件数据库。BOND 中为您熟悉的所有优秀功能都得到了改进，并且使用更方便，并能提供更多有见地的结果。

Bordwell pKa 表 (DMSO 中的活性) (威斯康星大学)]

由威斯康星大学麦迪逊分校的汉斯·J·赖希开发的一个方便的工具，用于查找一些常用试剂的 PKa 值。

BRENDA，综合酶信息系统

它提供多种搜索选项，包括快速搜索、全文搜索、高级搜索、亚结构搜索、taxtree 搜索等。

顶部

C

分子性质和类药性计算 (Molinspiration)

您可以在绘制化学结构后计算性质或预测生物活性。

CAMEO 化学品

一个包含超过 6,000 种危险物质的数据库（超过 82,000 个同义词）。每个化学品数据表描述了该物质及其特性，并包括有关火灾和爆炸危险、健康危害、灭火技术、清理程序和防护服的信息。

CATH，蛋白质结构分类

(按四个主要级别对蛋白质进行聚类，类别 (C)、结构 (A)、拓扑结构 (T) 和同源超家族 (H)) CATH 数据库是对蛋白质数据银行 (PDB, Berman 等人，2003) 中蛋白质结构的层次化域分类。只考虑分辨率优于 4.0 埃的晶体结构，以及 NMR 结构。所有非蛋白质、模型和“仅 C-alpha”超过 30% 的结构都从 CATH 中排除。使用 SIFT 协议 (Michie 等人，1996) 对 PDB 进行这种过滤。使用自动化和手动程序的组合对蛋白质结构进行分类。可以通过类别浏览数据库，也可以通过关键字搜索数据库。

CAZy，碳水化合物活性酶

CAZy 描述了结构相关的催化和碳水化合物结合模块（或功能域）的家族，这些模块是降解、修饰或产生糖苷键的酶。

CCCBDB计算化学比较与基准数据库（美国国家标准与技术研究院）

CCCBDB (http://srdata.nist.gov/cccbdb) 是一个包含 615 种中性气相物质的实验和理论热化学性质的集合。该数据库/网站的目标是为评估从头算计算方法提供一组基准分子和反应，并允许比较不同从头算计算方法和实验以预测热化学性质。用户可以通过使用该站点的数据来评估应用于热化学的从头算方法的准确性。实验和计算数据可用（生成焓以 kJ/mol 表示，计算能量以 hartrees 表示，振动频率列表，几何形状）并且可以在比较中使用。例如，可以针对实验和不同理论水平显示用户指定反应的焓值。CCCBDB 中目前包含的性质包括生成焓、熵、热容、几何形状、振动频率和内旋转势垒。

CCOHS

加拿大职业健康与安全中心拥有最全面的材料安全数据表 (MSDS) 之一。允许跨数据库进行免费搜索，但查看某些记录需要付费。数据库包括 MSDS、CHEMINFO（关于纯化学品的全面健康和安全信息）、CHEMpendium（CHEMINFO、CESARS、CHRIS、DSL/NDSL、HSDB、NJHS 事实表、NIOSH 袖珍指南、运输 TDG 和运输 49CFR 的组合数据库，以及 RTECS，化学物质毒性影响登记册）。

CEBS，生物系统中的化学效应

CEBS 由美国国立环境健康科学研究所制作，它编目了与毒素反应相关的所有基因产物。其目标是成为一个公开的毒理基因组学知识库。

ChEBI，生物学兴趣化学实体（EMBL-EBI，欧洲生物信息学研究所）

生物学兴趣化学实体 (ChEBI) 是一个免费提供的分子实体词典，专注于小分子化合物。ChEBI 包含本体分类，其中指定了分子实体或实体类别与其父级和/或子级之间的关系。

ChemBank

ChemBank 是一个由 Broad Institute 化学生物学计划创建的公共网络化信息环境，在很大程度上由美国国立癌症研究所的化学遗传学计划 (ICG) 提供资金。这个知识环境包括从小分子和小分子筛选衍生的免费数据，以及用于研究这些数据以获得生物学和医学见解的资源。ChemBank 的目的是指导化学家合成新的化合物或文库，帮助生物学家寻找扰乱特定生物途径的小分子，以及催化药物猎手发现新的有效药物的过程。

ChemBioBase 套件（Jubilant Biosystems）

ChemBioBaseTM 是一套全面的以靶点为中心的配体数据库，涵盖了所有目前研究关注的主要靶点。例如，Kinase ChemBioBaseTM 包含针对激酶靶点的 319,000 多种小分子。

ChemDB，加州大学欧文分校 ChemDB

ChemDB 包括 ChemicalSearch、Kpredictor、Smi2Depict 和 Babel。
ChemicalSearch：通过基本标准（如分子量和预测的 logP）或通过更抽象的结构相似性概念来查找化学物质。
Kpredictor：在线提交小分子结构，并使用我们的内核方法预测获得选定的物理化学性质值。
Smi2Depict：获取分子“SMILES”字符串列表，并生成相应的 2D 图像描述。
Babel：允许在各种分子文件格式之间直接转换。这对于将其他格式（如 SDF 和 Mol2）转换为大多数这些接口期望的 SMILES 字符串很有帮助。

ChemExper 化学目录

该数据库包含化学物质及其物理特性。ChemExper 化学目录包含 200,000 多种不同的化学物质、10,000 多个 MSDS 和 10,000 多个红外光谱。

ChemFinder（CambridgeSoft；需要插件进行子结构搜索）

自 1995 年以来，ChemFinder 一直为数十万科学家提供免费的化学搜索服务。这个免费数据库提供化学结构、物理性质和超链接。

美国化学文摘社

美国化学文摘社拥有全球最大的化学相关信息数据库，以及一套用于访问其中包含的信息的工具（SciFinder、STN 网页版、STN Easy 和 STN AnaVist）。CAS 制作的数据库包括

化学文摘 Plus (CAplus) 是美国化学文摘社 (CAS) 提供的当前全面化学文献数据库。CAplus 涵盖了化学、生物化学、化学工程及相关科学所有领域的国际期刊、专利、专利族、技术披露、技术报告、书籍、会议论文集、学位论文、仅电子期刊和网络预印本，时间范围从 1907 年至今，以及 180,000 多条 1907 年之前的专利和期刊文章记录。
CAS REGISTRY 文件是一个包含由 CAS 登记系统识别的物质记录的数据库。这些包括在 CAplus 和 CA 文件中索引的物质，以及特殊登记，例如，针对 TSCA 和 EINECS 等监管清单的登记。它包含大量关于化学物质的经验和计算物理化学性质。
CHEMCATS（在线化学目录）是一个目录文件，包含有关可商购化学品及其全球供应商的信息。
CHEMLIST，受监管的化学物质清单，识别来自全球 100 多个清单和监管清单的物质。记录包含物质识别信息、清单状态、信息来源以及监管活动、报告和其他合规信息的摘要。该数据库最初包含 TSCA、EINECS 和 ENCS 等国家化学清单。如今，它包括 HPV、污染物排放清单、优先化学品和具有运输限制的危险化学品等国际清单。
TOXCENTER（毒理学中心）是一个文献数据库，涵盖药物和其他化学品的药理学、生物化学、生理学和毒理学效应。它从各种来源汇编而来，包括 Medline、农药文摘、CAplus 等。

化学缩略语数据库（由印第安纳大学化学图书馆维护）

有两种方法可以搜索这个化学缩略语数据库（包含 14822 个参考资料）：按缩略语搜索和按关键字搜索。您还可以通过填写在线表格来输入新记录。

网络版化学动力学数据库（来自美国国家标准与技术研究院的气相反应数据）

NIST 化学动力学数据库包含了几乎所有关于热气相化学反应的动力学结果。该数据库旨在根据所涉及的特定反应物、导致指定产物的反应、特定物质的所有反应或这些反应的各种组合来搜索动力学数据。此外，还可以按作者姓名或姓名组合搜索参考文献。该数据库包含超过 11,700 个不同反应物对的 38,000 多个独立反应记录。这些数据是从 12,000 多篇论文中摘录的，文献覆盖范围截至 2000 年初。

化学结构查找服务 (CSLS)：数据库定位服务

CSLS 允许在 80 多个数据库中查找化合物，这些数据库包含超过 3900 万个条目（2700 万个独特的结构）。可以通过 InChI、SMILES、分子式和其他标识符搜索化合物。可以上传包含结构和 ID 的文件以在 CSLS 中执行搜索。

ChemIDplus（美国国立医学图书馆）

ChemIDplus 是 NLM 特色信息服务的其中一个程序。它允许按物质识别、毒性、物理性质、分子量、定位码和化学结构进行搜索。

cheML.io（纳扎尔巴耶夫大学计算机科学系和化学系）

cheML.io 是一个包含 ML 生成的分子的在线数据库^[1]。该网络服务提供子结构和类似条目搜索。除了结构信息外，它还包含每个分子的预先计算特征。该数据集包含从 10 个 ML 框架中采样的 280 多万个 ML 生成的分子。对数据的访问是开源的。

ChemMine（加州大学河滨分校植物细胞生物学中心）

ChemMine 是一款集成的化合物挖掘服务和数据库。其目标是促进化学基因组学筛选并传播生成的知识。该数据库提供访问来自公共和商业供应商的各种生物活性、天然和筛选化合物。可以通过化学性质、子结构匹配、结构相似性和生物活性来搜索它们的结构和功能注释。除了全面的信息检索系统外，ChemMine 还是一种用于分析先导化合物的结构和化学性质的化学信息学服务。这项在线服务可用于数据库中表示的化合物以及用户提供的化合物。当前的在线分析工具集包括基于结构的化合物聚类、化学描述符的生成以及各种查看和重新格式化功能。

Chemspace

Chemspace 是一个免费的小分子数据库：构建块、片段和筛选化合物。该数据库提供对来自全球供应商的超过 1 亿种现货和按需化合物的信息访问。Chemspace 还为客户提供药物发现解决方案。所有注册用户都可以将免费的 Chemspace KNIME 节点嵌入到其定制的内部工作流程中，以便直接在 Chemspace 数据库中进行搜索，而无需使用浏览器。

ChemSpider（英国皇家化学会）

ChemSpider 是一个免费的化学结构数据库，提供对超过 2500 万种结构、性质和相关信息的快速访问。通过整合和链接来自 400 多个数据源的化合物，ChemSpider 使研究人员能够从单次在线搜索中发现对免费可用化学数据的最全面视图。

ChemSynthesis 化学数据库

一个可免费访问的化学品数据库，包含具有其合成参考文献和物理性质（如熔点、沸点和密度）的物质。该数据库目前包含超过 40,000 种化合物和超过 45,000 份合成参考文献。

Chem_xSeer（宾夕法尼亚州立大学）

一个集成的数字图书馆和数据库，允许对化学领域中的文档和从化学动力学获得的数据进行智能搜索。数据存储库组件包含从各种来源获得的实验数据。他们的工具可以处理、存储和链接多种格式的数据，例如 Excel、XML、高斯和 Charmm。元数据附加组件可以帮助注释数据并链接多个数据集。

Chirbase，一个用于手性色谱法的分子数据库

Chirbase 包含 95,000 种手性分离、30,000 种分子结构和 4000 种每四个月更新的新分离。它是一个强大的信息系统，用于通过色谱法分离对映异构体。

协作药物发现数据库

CDD 使科学家能够在努力更有效地开发用于商业和人道主义市场的新的候选药物方面进行合作。系统中的数据集包括 FDA 孤儿药和获批药物以及小分子药物发现数据，涵盖疟疾、肺结核、非洲昏睡病、恰加斯病和利什曼病等疾病。

晶体学开放数据库，COD

COD 中约有 43,000 个条目（2006 年 6 月 16 日）。COD 为搜索提供 2 个强大的选项：通过以您选择的组合方式：文本（2 个单词或单词的一部分）、元素（1 到 8，有或没有公式编号）、体积（最小值和最大值）以及元素的严格数量；通过晶胞参数范围 amin-amax、bmin-bmax 等。

细胞色素 P450 药物相互作用表（印第安纳大学 - 普渡大学 - 印第安纳波利斯分校）

此表设计为一个假设检验、教学和参考工具，供对药物相互作用感兴趣的医生和研究人员使用，这些药物相互作用是竞争或对人类细胞色素 P450 系统的影响的结果。临床医生和医疗保健提供者可能会发现简化的临床表格更实用，该表格专为处方期间的实际使用而设计。

顶部

D

数据和属性计算网站（伊利诺伊大学芝加哥分校热力学研究实验室）

您可以在此处找到指向许多纳米、量子、统计力学和热力学数据以及属性计算网站的链接。

DIP（相互作用蛋白质数据库）

DIPTM 数据库对实验确定的蛋白质间相互作用进行分类。它结合来自各种来源的信息以创建一组一致的蛋白质-蛋白质相互作用。存储在 DIP 数据库中的数据经过人工整理，由专家整理人员进行，也通过利用从 DIP 数据最可靠的核心子集中提取的蛋白质-蛋白质相互作用网络知识的计算方法进行整理。

DisProt 蛋白质无序数据库

蛋白质无序数据库 (DisProt) 是一个经过整理的数据库，提供有关在其推测的天然状态下（无论是全部还是部分）缺乏固定 3D 结构的蛋白质的信息。DisProt 是印第安纳大学医学院计算生物学与生物信息学中心和坦普尔大学信息科学与技术中心的合作成果。

杜克博士的植物化学和民族植物学数据库

该数据库允许进行植物搜索、化学搜索、活性搜索和民族植物学搜索。还允许浏览数据库。

DrugBank（阿尔伯塔大学）

它包含有关 3,000 多个药物靶点和 4,100 种获批或实验性药物产品的化学、药物、医学和分子生物学信息。

DrugMatrix（Iconix 制药）

DrugMatrix 是毒理基因组学这一新领域中的第一个综合研究工具。它使研究人员能够在药物发现和开发的最早、最具成本效益的阶段选择最优质的先导化合物和候选药物，并消除可能失败的候选药物。

顶部

E

ECOTOX（美国环境保护署）

ECOTOXicology 数据库 (ECOTOX) 是查找水生生物、陆地植物和野生动物单一化学物质毒性的来源。ECOTOX 将三个以前独立的数据库——AQUIRE、PHYTOTOX 和 TERRETOX——整合到一个独特的系统中，该系统包含主要来自同行评审文献的毒性数据，分别用于水生生物、陆地植物和陆地野生动物。

eMolecules（以前称为 Chmoogle）

通过绘制结构或使用 SMILES 来搜索化学品供应商信息的一个好来源。供应商联系信息在记录中提供。高级搜索允许进行子结构和精确结构搜索。对于专家搜索，您必须先登录。eMolecules 中不包含反应和化学性质信息。

The National Cancer Institute (NCI) database consists of approximately 250,000 structures. The browser has the

以下功能

子结构搜索功能（例如，搜索氢键受体/供体）
扩展的搜索条件（计算的 log P、复杂度、数据可用性）
PASS 活性谱预测（> 500 种作用机制）
输出功能，例如 MDL Chime、3D Java 查看器、VRML 场景、电子表格
3-D 药效团搜索功能
指向其他服务的链接，用于进一步处理搜索结果

Entrez，生命科学搜索引擎（美国国家生物技术信息中心）

一个综合门户网站，用于搜索生命科学数据库。

Envirofacts 主化学整合器 (EMCI)（美国 EPA）

您可以使用此表单搜索 EMCI 化学参考网页提供的全部信息文本。

环境命运数据库 (EFDB)（Syracuse 研究公司）

EFDB 包含 Datalog、Biolog、Chemfate、Biodeg 和 Biodeg Summary 等文件。

EUROSPEC，国际光谱数据库

国际光谱数据库 (ISDB) 是一个电子数据库和档案，用于存储光谱和物质数据，供科学界访问。

EXTOXNET，扩展毒理学网络

涵盖以下主题

不良健康影响和风险
饮食与癌症
食品安全
家庭有害废物
室内空气
杀虫剂
安全饮用水
土壤（园艺和化学品）

顶部

F

Fisher Scientific

它可以用作电子化学目录。例如，您可以通过文本、模板和混合搜索搜索 ACROS。

Flexweb；生物分子和网络灵活性的分析

Flexweb 是一个门户网站，用于研究网络的灵活性以及相关的软件。它包含指向 Flexweb 托管的各种软件应用程序的链接。大多数软件可供学术团体下载，包括仅可执行文件和完整源代码分发。

顶部

G

Open Science Grid 上的 GADU VO

GADU（基因组分析和数据库更新）VO（虚拟组织）提供以下服务

从越来越多的分析工具以及越来越多的源序列数量和规模中，对集成的公共数据库进行可靠的及时更新。
执行用户指定的模型。
基于 Web 的门户访问所有服务。
自定义序列分析工作流程。

部分甲基化醇糖乙酸酯的 GC-EIMS

部分甲基化醇糖乙酸酯的电子轰击质谱。

生成的化学宇宙小分子数据库

包含 C、N、O 或 F 形成的每个可能的有机分子，最多包含 11 个原子，考虑到化学稳定性和合成可行性；2640 万种化合物。

量子化学常用术语和缩略语词汇表（Karl K. Irikura）

量子化学文献，涵盖分子轨道理论和密度泛函理论，充斥着缩写、首字母缩略词和行话。本词汇表解释了一些更常见的术语。列出了引用的文献。

糖类数据库

该数据库是功能糖组学联盟的专业数据库之一，用于糖类结合蛋白、糖类结构和糖基转移酶。总的来说，它们提供了一种独立的方式来访问 CFG 数据，以及整合大量公开可用的信息。它们是开发一个将正在生成的各种类型数据整合起来的生物信息学资源的关键，也是朝着糖生物学的综合系统生物学方法迈出的重要一步。

glycoSCIENCES.DE

该网站提供的数据库包括文献搜索、质谱搜索、核磁共振、结构和 PDB 搜索。

顶部

H

HIC-Up，杂环化合物信息中心，乌普萨拉

该网站包含有关在蛋白质数据库 (PDB) 文件中遇到的杂环化合物的信息。它每年更新几次。

HIV/OI/TB 治疗数据库（美国 NIAID 艾滋病分部）

这些数据库可以通过化合物名称和作者姓名进行搜索。

人类代谢组数据库

自 2004 年以来，人类代谢组项目已经收集了大约 2,500 种分子（2007 年初），这些分子是由人体组织和体液中的代谢反应产生的。该数据库旨在包含或链接三种类型的数据：1) 化学数据，2) 临床数据和 3) 分子生物学/生物化学数据。它包括水溶性和脂溶性代谢物，以及被认为是丰富（> 1 uM）或相对罕见（< 1 nM）的代谢物。此外，大约 5500 个蛋白质（和 DNA）序列与代谢物条目相关联。

人类蛋白质参考数据库

人类蛋白质参考数据库是一个集中的平台，用于可视化地描述和整合有关人类蛋白质组中每个蛋白质的结构域架构、翻译后修饰、相互作用网络和疾病关联的信息。HPRD 中的所有信息都是由专家生物学家从文献中手动提取的，他们阅读、解释和分析已发表的数据。HPRD 是使用 Zope 中的面向对象数据库创建的，Zope 是一个开源 Web 应用程序服务器，它在查询功能方面提供了灵活性，并允许动态显示数据。

顶部

I

I-ChemiSt, 智能化学结构数据库]（质谱和核磁共振谱数据库）

质谱数据库包含复杂碳水化合物分子的部分甲基化乙酸酯醛糖醇（PMAAs）的气相色谱-电子电离质谱（GC-EIMS）。目前，该数据库包含 600 多个 GC-EIMS 谱图。核磁共振谱数据库仍在建设中。

iHOP，蛋白质间超链接信息

iHOP 服务通过自动从 PubMed 文档中提取关键句子，提供有关 1,500 多种生物体和 80,000 多个基因的摘要信息。

印第安纳大学分子结构中心

印第安纳大学分子结构中心是互惠网络网站网络的合作伙伴之一。互惠网络网站网络是一个分布式数据库，用于晶体学信息，它由世界各地的参与晶体学实验室运行。一些样本可供公众免费使用，无需身份验证。授权用户登录后可以跳转到另一个网站的数据库或访问 ReciprocalNet.org 的主服务器。

Infotherm 热物理性质数据库（FIZ Chemie Berlin）

数据类型：来自 9,900 种化合物中总共 27,000 种混合物和 7,200 种纯物质的实验热力学和物理性质
数据库增长：每月约 1,000 张表
内容：183,000 张 PVT 状态值表和图表，相平衡数据，传输和表面性质，热量，光学和声学性质
材料类型：75% 有机，20% 无机和 5% 有机金属化合物，重点是溶剂
来源：13,100 篇来自期刊和报告的出版物，以及印刷和电子格式的测量方案和数据收集，时间跨度从 1919 年至今

IntAct（蛋白质相互作用数据库）

IntAct 提供一个免费的开源数据库系统和用于蛋白质相互作用数据的分析工具。所有相互作用都来自文献整理或直接用户提交，并免费提供。

IUPAC-NIST 溶解度数据库（由国际纯粹与应用化学联合会编制和评估的数据）

该数据库包含 67,500 多个溶解度测量值，这些测量值来自 IUPAC 溶解度数据系列的 18 卷。该数据库包含约 1800 种化学物质和 5200 个体系，其中 473 个已过严格评估。该数据库包含 1800 多个参考文献。典型的溶剂和溶质包括水，海水，重水，无机化合物以及各种有机化合物，如烃，卤代烃，醇，酸，酯和氮化合物。

顶部

J

联合专家物种系统，JESS（用于复杂水生环境中化学物种热力学和动力学建模的工具）

JESS 是一个强大的研究工具，用于对复杂水生环境中的化学物种进行建模。它旨在解决需要对溶液化学的专业知识的问题。它目前包含 250 多个程序，2000 多个子程序和 234,000 行 Fortran 代码。

顶部

K

KEGG API

KEGG API 为访问 KEGG 系统提供了宝贵的方法，例如用于搜索和计算细胞过程中生化途径或分析完全测序基因组中的基因宇宙。用户可以通过 HTTP 协议上的 SOAP 技术访问 KEGG API 服务器。SOAP 服务器还附带 WSDL，这使得为特定计算机语言构建客户端库变得容易。这使用户能够为许多不同的目的编写自己的程序，并自动执行访问 KEGG API 服务器并检索结果的过程。

KEGG 配体数据库

与生命相关的化学物质和反应的数据库。它是一个复合数据库，目前包含 COMPOUND、DRUG、GLYCAN、REACTION、RPAIR 和 ENZYME 数据库。ENZYME 来自酶命名法，但其他数据库是内部开发和维护的。KEGG Ligand 包含用于执行相似性搜索并预测反应和反应途径的工具。

KEGG 途径

KEGG PATHWAY 是一个手动绘制的途径图集合，代表了我们对以下方面的分子相互作用和反应网络的了解：

代谢
遗传信息处理
环境信息处理
细胞过程
人类疾病
药物开发

激酶知识库 (KKB)（Eidogen-Sertanty）

激酶知识库 (KKB) 是 Eidogen-Sertanty 的激酶结构-活性及化学合成数据数据库。目前，激酶知识库涵盖以下数据（截至 2006 年 8 月）：期刊文章和专利：>2,600；生物活性数据点数量：>222,000。

KiNET 蛋白质组学数据库

KiNET 是同类中第一个可通过互联网访问的订阅蛋白质组学数据库。它具有内置的生物信息学搜索功能，用于细胞信号转导研究。KiNET 包含来自 6000 多个蛋白质印迹的数百种信号转导蛋白的表达和磷酸化状态的 200,000 多个测量值，这些印迹是在对照和处理后的组织/细胞样本中进行的。

顶部

L

生命科学网关

生命科学网关 (LSGW) 为生物信息学家提供应用服务。LSGW 使最终用户能够将 TeraGrid 的大规模资源应用于他们的问题，但它也允许应用服务提供商利用本地资源，创建一个服务提供商层次结构，可以开始满足整个生物信息学社区的计算和数据需求。

LIPIDAT（有关脂质中间相和晶体多晶型转变的热力学和相关信息）

LIPIDAT 是一个有关脂质中间相和晶体多晶型转变的热力学和相关信息的关联数据库。LIPIDAT 中有 19,959 条记录。该数据库包括脂质分子结构。当前版本的 LIPIDAT 中的大部分条目是针对甘油脂和鞘脂。

LIPIDBANK

该数据库是由日本国际医疗中心和日本科学技术振兴机构联合研究项目开发的。可以使用关键字、分类、支链、油或脂肪名称、数字或位置搜索 LIPID 数据库。

LIPID MAPS（脂质代谢物和途径策略）

称为 LIPID MAPS 的脂质代谢物和途径策略已被开发出来，用于对脂质组学研究应用全局整合方法。

顶部

M

MatWeb，一个可搜索的材料数据表数据库

MatWeb 的核心是一个可搜索的材料数据表数据库，包括有关热塑性和热固性聚合物（如 ABS、尼龙、聚碳酸酯、聚酯、聚乙烯和聚丙烯）的性能信息；金属，如铝、钴、铜、铅、镁、镍、钢、超级合金、钛和锌合金；陶瓷；以及半导体、纤维和其他工程材料。可以使用文本搜索、分类搜索（材料类型、聚合物制造商、聚合物商品名、金属 UNS 号）和定量搜索进行搜索。

MedChem/Biobyte QSAR 数据库（波莫纳学院）

医学主题词，MeSH（美国国家医学图书馆）

MeSH 是美国国家医学图书馆的受控词汇词典。它包含一组命名描述符，这些描述符在层次结构中排列，允许在不同特异性级别进行搜索。MeSH 中有 22,997 个描述符。除了这些标题之外，在单独的词典中还有 151,000 多个称为补充概念记录（以前称为补充化学记录）的标题。还有数千个交叉引用，帮助找到最合适的 MeSH 标题，例如，维生素 C 参见抗坏血酸。这些附加条目包括 24,050 个打印的参见引用和其他 112,012 个条目点。MeSH 词典用于 NLM 为 MEDLINE/PubMED® 数据库中来自世界领先的 4,800 家生物医学期刊的文章编制索引。

MEDPHYT（药用植物数据库）

Registration is required to use this database.

MetaCyc 代谢途径百科全书

MetaCyc 是一个非冗余的、经过实验阐明的代谢途径数据库。MetaCyc 包含来自 600 多种不同生物体的 700 个途径。MetaCyc 是根据科学实验文献进行整理的。它存储了参与初级代谢（包括光合作用）、次级代谢以及相关化合物、酶和基因的途径。

金属蛋白数据库和浏览器

该数据库包含来自 PDB 分布结构中所有含金属位点的定量信息。它包含几何和分子信息，允许对特定位点特征组合进行分类和搜索，并回答诸如“有多少单核锌位点是五配位的，X 射线分辨率优于 1.8 埃？”之类的问题。然后，可以可视化和操作匹配的位点。该数据库还包含足够的信息来回答涉及配体类型和数量的问题（例如，“至少 2 个 His”），并包括距离截止条件（例如，“金属-配体距离不超过 3.0 埃且不少于 2.2 埃”）。

Metlin 代谢物数据库

METLIN 是一种基于网络的数据管理系统，旨在通过提供对其当前和全面的质谱代谢物数据的公开访问来协助广泛的代谢物研究和代谢物鉴定。

MINT 分子相互作用数据库

MINT 专注于从科学文献中由专家馆员挖掘的经过实验验证的蛋白质相互作用。经过整理的数据可以在高通量数据的背景下进行分析，并使用“MINT 查看器”以图形方式查看。

myGRID

myGrid 项目开发了一套全面的松散耦合的中间件组件，专门用于支持生物学中数据密集型计算机模拟实验。工作流和查询规范使用 Web 服务协议将第三方和本地资源连接在一起。该软件可以免费下载，并且已被用于为调查威廉姆斯-贝伦综合征和格雷夫斯病的合作生命科学家构建发现工作流。（引自 myGRID 主页）

Mol-Instincts

Mol-Instincts 是全球首个基于量子力学和 QSPR（定量构效关系）的化学基础数据库，提供化学物质的物理和化学性质、热力学数据、光谱数据以及许多其他基本信息。它是基于 41 项专利技术构建的最大和最全面的数据库之一，包含超过 250 万种化合物和 100 亿组数据和信息。

顶部

N

美国国家毒理学计划（美国卫生与公众服务部）

NTP 是一个机构间计划，其使命是通过开发和应用现代毒理学和分子生物学的工具来评估公众健康关注的物质。

美国国家药品代码目录（美国食品药品监督管理局药品评价与研究中心）

美国为商业分销而制造、制备、繁殖、配制或加工的所有药物的当前清单。药物产品使用一个独特的、三段式的数字（称为国家药品代码 (NDC)）进行识别和报告，该数字是人类药物的通用产品标识符。FDA 将完整的 NDC 号码和作为清单流程一部分提交的信息输入到称为药物注册和清单系统 (DRLS) 的数据库中。FDA 每年几次从 DRLS 数据库中提取部分信息（目前，已正确列出的上市处方药产品和胰岛素），并在 NDC 目录中发布这些信息。

NAViGaTOR（多伦多大学）

一个用于可视化和分析蛋白质-蛋白质相互作用网络的软件包。NAViGaTOR 可以查询 OPHID / I2D - 交互数据在线数据库 - 并以 2D 或 3D 显示网络。为了提高可扩展性和性能，NAViGaTOR 将 Java 与 OpenGL 结合使用，以在多个硬件平台上提供 2D/3D 可视化系统。NAViGaTOR 还提供分析功能并支持标准导入和导出格式，如 GO 和蛋白质组学标准倡议 (PSI)。

NDRL/NIST 溶液动力学数据库（美国国家标准与技术研究院）

NetPhosK 1.0 服务器

生成真核蛋白质磷酸化位点的激酶特异性神经网络预测。目前，NetPhosK 涵盖以下激酶：PKA、PKC、PKG、CKII、Cdc2、CaM-II、ATM、DNA PK、Cdk5、p38 MAPK、GSK3、CKI、PKB、RSK、INSR、EGFR 和 Src。

美国国立卫生研究院 DTP 癌细胞系活性预测（印第安纳大学）

美国国立卫生研究院发育治疗计划提供了一组 60 种癌细胞系，对这些细胞系进行了约 42,000 种化合物的筛选。IU 数据库为用户指定的化合物集返回所有 60 个细胞系的活性预测。请注意，从美国国立卫生研究院获得的数据是实值的，并且可用于三个浓度参数。这些模型是使用 log GI50 开发的，截止值为 5.0。预测是使用一组随机森林模型获得的，每个细胞系使用一个模型，使用 166 位 MACCS 键作为特征。

美国国家职业安全与健康研究所数据库和信息资源（美国国家职业安全与健康研究所）

这些数据库按化学品、伤害、疾病和危险数据和信息、出版物、呼吸器和其他个人防护装备、农业和建筑分类。最受欢迎的数据库包括国际化学品安全卡、美国国家职业安全与健康研究所化学危险袖珍指南和NIOSHTIC-2。

美国国家标准与技术研究院化学网络手册（美国国家标准与技术研究院）

该网站提供美国国家标准与技术研究院在标准参考数据计划下编制的热化学、热物理学和离子能数据。

美国国家标准与技术研究院数据网关

网关包含指向选定的免费在线美国国家标准与技术研究院数据库的链接，以及指向可供购买的美国国家标准与技术研究院数据库的信息。您可以在美国国家标准与技术研究院科学和技术数据库集中搜索特定关键字、属性和物质。您将获得一个可能包含您需要信息的数据库列表。

美国国家标准与技术研究院物理实验室物理参考数据（美国国家标准与技术研究院）

您可以通过元素获取对数据库数据的访问权限。您也可以使用链接访问有关物理常数、原子光谱数据、分子光谱数据、X 射线和伽马射线数据、核物理数据等的所有信息。

美国国家标准与技术研究院科学和技术数据库（美国国家标准与技术研究院）

此在线数据库资源涵盖化学、材料、数学、物理、光学、热物理学和热化学中的各种数据库。

NMRShift DB

NMRShiftDB 是一个用于有机结构及其核磁共振 (nmr) 光谱的网络数据库。它允许光谱预测（目前仅限于碳），以及搜索光谱、结构和其他属性。最后但并非最不重要的一点是，它允许其用户同行评审地提交数据集。
集合（2005-08-30）：15944 种结构和 17925 种光谱；1423 种质子光谱；大约 1500 种结构，具有不同类型的光谱。

核酸数据库（罗格斯大学：一个关于核酸三维结构信息的存储库）

这是一个关于核酸三维结构信息的存储库。您可以执行三种类型的搜索

NDB 搜索：搜索通过 X 射线晶体学或 NMR 确定的含核酸结构。
NDB 集成搜索：另一种 NDB 搜索应用程序，提供更灵活的搜索和报告生成功能。
NDB 状态搜索：提供有关晶体结构处理状态的报告。

顶部

O

有机合成

可以通过单个卷的目录表（“期刊模式”）或通过执行结构和关键字搜索（“数据库模式”）访问有机合成程序。对于有机化学家来说，这是一个很好的合成“食谱”来源。

OWL，复合蛋白质序列数据库（涵盖 SWISS-PROT、PIR、GenBank 和 NRL-3D）

OWL 是 4 个公开可用的主要来源的非冗余组合：SWISS-PROT、PIR（1-3）、GenBank（翻译）和 NRL-3D。SWISS-PROT 是最高优先级的来源，所有其他来源都与它进行比较，以消除相同和微不足道的不同序列。可以通过登录号、数据库代码、文本、序列、标题、作者、查询语言和正则表达式访问 Owl。

顶部

P

专利分析免费数据库

提供对美国专利数据库、欧盟专利数据库和 WO/PCT 专利数据库的免费访问，以及即将提供的免费 INPADOC 和日本专利搜索。要访问免费专利数据库，需要创建一个帐户并登录。高级搜索服务，如 Idea Analysis 和 SureChem 需要付费订阅。由 Reel Two 出品的 SureChem 包含从 USPTO、EPO 和 WO 专利的全文中挖掘的 540 多万种独特结构。SureChem 用户可以通过子结构或相似性进行搜索。数据导出让客户可以在他们的桌面上分析结果或将它们纳入任何信息学工作流程。SureChem 门户还为用户提供了一系列用于化学和通用搜索的先进专利搜索工具。所有新用户都可以享受 7 天免费试用。

通路相互作用数据库

通路相互作用数据库是一个高度结构化的、经过整理的关于已知生物分子相互作用和关键细胞过程的信息集合，这些信息被整合到信号通路中。它是美国国家癌症研究所 (NCI) 和自然出版集团 (NPG) 之间的合作项目。

PDB，蛋白质数据库

蛋白质数据库 (PDB) 是关于大型生物分子（包括蛋白质和核酸）的三维结构信息的全球单一存储库。这些是存在于所有生物体（包括细菌、酵母、植物、果蝇和小鼠）以及健康和患病的人类中的生命分子。了解分子的形状有助于了解它的工作原理。通过 RCSB PDB 可以获得与每个结构相关的各种信息，包括序列细节、原子坐标、结晶条件、使用各种方法计算的三维结构邻居、派生的几何数据、结构因子、三维图像以及指向其他资源的各种链接。截至 10 月 17 日，PDB 中存储了 39464 个结构。

PDSP K_i 数据库

该数据库有 44,913 个 K_i 值可供搜索，并且还在不断增长

Pharmabase：细胞生理学和药理学数据库

关于在细胞研究中使用药物化合物的数据库。

物理性质数据库 (PHYSPROP)

PHYSPROP 包含 25,250 多种化学物质的化学结构、名称和物理性质。物理性质从各种来源收集，包括熔点、沸点、水溶性、辛醇-水分配系数、蒸气压、pKa、亨利定律常数和大气中 OH 反应速率常数的实验值、外推值和估计值。

国家化学实验室蛋白质数据库（印度浦那）

MOLTABLE 门户网站是为化学信息学环境中的小分子而建立的，现在正在扩展到生物分子，特别是蛋白质数据。MOLTABLE 门户网站将展示蛋白质化学中的“配体空间”。

木葡聚糖的质子核磁共振谱

包含一个可搜索的木葡聚糖寡糖醛糖醇的质子核磁共振化学位移表。木葡聚糖的寡糖亚基是通过内切葡聚糖酶处理聚合物并用硼氢化钠还原而生成的。硼氢化物处理通过将还原残基的相互转换的异头形式转化为单一的稳定部分（醛糖醇）来简化每种木葡聚糖寡糖的纯化和光谱分析。所得寡糖醛糖醇的质子核磁共振化学位移相似，但不完全相同于母体还原寡糖的化学位移。

PubChem

PubChem 提供有关小分子生物活性信息。它是 NIH 分子库路线图计划的一部分。PubChem 包含物质信息、化合物结构和生物活性数据，分别存储在三个主要数据库中：PCSubstance、PCCompound 和 PCBioAssay。PCSubstance 包含超过 1500 万条记录；PCCompound 包含超过 1000 万个独特的结构；PCBioAssay 包含超过 300 个生物测定。每个生物测定包含各种数据点。

PubChemSR（搜索和检索）工具

PubChemSR（搜索和检索）是 NCBI 化学数据库 PubChem 的一个基于 MS-Windows 的数据搜索和检索工具。PubChemSR 是用 MS Visual Basic .Net 编写的，并通过 SOAP（简单对象访问协议）使用 Entrez Eutilities 实现。它只在 Windows XP 上测试过，但它应该在任何其他 Windows 平台上都能很好地工作。PubChemSR 有一些特殊功能，例如针对三个 PubChem 数据库（PubChem Compound、PubChem Substance 和 PubChem BioAssay）中的任何一个进行文本（关键字）搜索，以及对拼写错误的搜索词进行拼写校正。

PubDock；用于发现的 PubChem 对接（印第安纳大学）

PubChem Dock 存储大规模对接计算的结果，包括目标的 PDB 结构、对接配体的 3D 结构和对接分数。目前评估了 Openeye 的 fred 提供的四个评分函数，即

chemgauss3
shapegauss
oechemscore
plp

对于每个评分函数，总分数以及分量分数都被保存。数据库目前包含针对六种蛋白质（1YC4、1R1P、1YC3、1YC1、1XP6、1QKT）的对接结果。计划用蛋白质家族的对接结果来填充 PubDock。一种可能的用途是使用相似性方法对家族进行配体筛选。

PubMed Central (PMC)

PMC 是美国国立卫生研究院 (NIH) 的免费生物医学和生命科学期刊文献数字档案。除了作为档案的作用之外，PubMed Central 的价值还在于，当来自不同来源的数据以统一的格式存储在单个存储库中时，可以做什么。

顶部

Q

Query Chem

您可以将文本和化学结构结合起来进行网络搜索。根据 Google Web API 许可协议的规定，Query Chem 每天限于 1000 次“未加密钥”的 Google 搜索，并由 Chembank、PubChem 和 Emolecules 提供支持。

QCLDB II 量子化学文献数据库

这是一个关于 1978 年以后出版的论文的数据库，这些论文处理原子和分子电子结构的从头计算。从大约三十种核心期刊中收集、调查这些论文，并由一群年轻的日本量子化学家提供适当的标签，揭示论文的内容和本质。

顶部

R

Reactome，一个经过整理的生物途径知识库

Reactome 是冷泉港实验室、欧洲生物信息学研究所和基因本体论联盟之间的一项合作，旨在开发一个经过整理的人类生物学核心途径和反应资源。该数据库中的信息由生物学研究人员（在其领域拥有专业知识）编写，由 Reactome 编辑人员维护，并与 NCBI、Ensembl 和 UniProt 的序列数据库、UCSC 基因组浏览器、HapMap、KEGG（基因和化合物）、ChEBI、PubMed 和 GO 互引。除了经过整理的人类事件之外，还提供了 22 种非人类物种（包括小鼠、大鼠、鸡、斑马鱼、蠕虫、果蝇、酵母、两种植物和 E.coli）中推断出的直系同源事件。

顶部

S

SCOP，蛋白质结构分类

SCOP 数据库旨在提供对所有已知结构的蛋白质之间结构和进化关系的详细而全面的描述，包括蛋白质数据库 (PDB) 中的所有条目。它可以作为一组紧密链接的超文本文档获得，这些文档使大型数据库易于理解和访问。此外，超文本页面还提供了蛋白质的多种表示，包括指向 PDB 条目、序列、参考文献、图像和交互式显示系统的链接。

Sigma-Aldrich 化学数据库

Sigma-Aldrich 是世界上领先的化学品供应商之一。该网站提供子结构搜索和反应搜索功能。

SitesBase

SitesBase 是 PDB 中已知配体结合位点的数据库，可以通过 PDB 标识符或配体 3 字母代码（例如 NAD）进行导航。每个结合位点都包含一个经常更新的类似结合位点登记表，这些结合位点共享通过几何散列检测到的原子相似性（Brakoulias 和 Jackson 2004）。还提供多重比对、结构叠加和指向其他结构数据库的链接，以进行进一步分析。

SOLV-DB（来自国家制造科学中心的溶剂数据）

SOLV-DB 由国家制造科学中心提供，是溶剂数据的单一来源。SOLV-DB 收集了有关商业上可获得的溶剂的大量信息。使用 SOLV-DB 查找

选择和使用溶剂时涉及的健康和安全注意事项。
影响特定溶剂适合广泛潜在应用的化学和物理数据。
监管责任，包括暴露和排放限值，根据几个关键法规的危险分类状态，以及选定的报告要求。
环境归宿数据，以表明溶剂是否可能在空气或水中分解或持续存在，以及可能适用的废物处理技术类型。

SPECARB，碳水化合物的拉曼光谱

SPECARB 是一个实验数据库，包含碳水化合物的拉曼光谱。它旨在包含来自单体（醛糖、酮糖和葡糖脂）及其衍生物到复杂多糖的碳水化合物的固态拉曼光谱。

有机化合物光谱数据库，SDBS（日本国立先进工业科学技术研究所 (AIST)）

SDBS 是一个有机化合物集成光谱数据库系统，它在化合物目录下包含 6 种不同类型的光谱。六种光谱如下：电子轰击质谱 (EI-MS)、傅里叶变换红外光谱 (FT-IR)、1H 核磁共振 (NMR) 光谱、13C NMR 光谱、激光拉曼光谱和电子自旋共振 (ESR) 光谱。截至 2004 年 9 月底，数据的数量如下

化合物：约 32,200 个化合物已更新
MS：约 22,900 个光谱已更新
1H NMR：约 14,000 个光谱已更新
13C NMR：约 12,300 个光谱已更新
FT-IR：约 49,800 个光谱已更新
拉曼：约 3,500 个光谱
ESR：约 2,500 个光谱。

SRC 指针文件的子结构搜索（Syracuse Research Corporation）

该文件包含 18,620 种化学物质，可以通过 ChemS3 提供的子结构和精确搜索进行访问，ChemS3 是为互联网和内部网应用程序开发的化学搜索引擎。

SUGABASE，碳水化合物核磁共振数据库

该网站是 SUGABASE 数据库的实验性 WWW 接口，SUGABASE 是一个碳水化合物核磁共振数据库，它将 CarbBank 复杂碳水化合物结构数据 (CCSD) 与质子和碳化学位移值相结合。它可以用于对碳水化合物结构和/或核磁共振数据进行简单搜索。结构以 CCSD 格式呈现。核磁共振数据显示为化学位移表

合成方案（波士顿大学化学方法学和库开发中心）

用于固相、液相和库合成程序的数据库。

顶部

T

TeraGrid 生物门户网站

该系统支持数据库搜索、比对和系统发育、模式搜索、DNA/RNA 分析和蛋白质分析。它通过提供统一的外观和功能来收集和统一数据和应用程序。

治疗靶点数据库

A database to provide information about the known and explored therapeutic protein and nucleic acid targets, the targeted disease, pathway information and the corresponding drugs/ligands directed at each of these targets. Also included in this database are links to relevant databases that contain information about the function, sequence, 3D structure, ligand binding properties, enzyme nomenclature and related literatures of each target.This database currently contains 1535 targets and 2107 drugs/ligands.

TOXNET，毒理学数据网络（美国国立医学图书馆）

TOXNET 涵盖有关毒理学、有害化学物质、环境健康和有毒物质排放的数据库。这些数据库包括 HSDB、ChemIDPlus、DART 等等。

顶部

U

英国 PubMed Central

基于美国国立卫生研究院 (NIH) 免费的生物医学和生命科学期刊文献数字档案 PubMed Central (PMC)，英国 PubMed Central (UKPMC) 提供了一个稳定、永久且可免费访问的全文本同行评审研究出版物在线数字档案。

UniProt

UniProt 是一个关于蛋白质的综合信息目录。它是一个蛋白质序列和功能的中央存储库，由瑞士蛋白质数据库 (Swiss-Prot)、TrEMBL 和 PIR 中的信息整合而成。UniProt 知识库 (UniProtKB) 是对经过精心整理的蛋白质信息的中心访问点，包括功能、分类和交叉引用。UniProt 参考聚类 (UniRef) 数据库将密切相关的序列组合成单个记录，以加速搜索。UniProt 档案 (UniParc) 是一个综合存储库，反映了所有蛋白质序列的历史。

美国国家癌症研究所发展治疗项目

DTP 数据库包括

研究药物 - 化学信息：关于 DTP 项目中过去或现在候选药物的化学和物理数据。包括化学结构、名称、生物数据（在人类肿瘤细胞系筛选中的活性）、毒性数据、溶解度、稳定性、紫外可见光谱和高效液相色谱数据。
COMPARE 数据库和癌症研究分析工具：可以使用化合物的 NCI 登录号（NSC 号）指定探针或“种子”化合物。然后，COMPARE 算法根据 60 种细胞系对数据库中化合物的反应与这些细胞系对种子化合物的反应的相似性对整个数据库进行排名。
NCI 筛选数据 3D 挖掘器：该数据库在首次发布时包含来自原始 DTP 表格的 216,089 个名称（45,229 种化合物）、44,804 个艾滋病抗病毒筛选结果、41,000 个抗肿瘤化合物和来自原始 DTP 来源的 122,631 个 CAS 号码。

顶部