化学信息来源/SIRCh/化学信息学/什么是化学信息学?
SIRCh:化学精选互联网资源
化学信息学,也称为化学信息学或化学信息学,是将计算机技术应用于化学及其所有表现形式。目前化学信息学技术的主要应用领域是制药行业。事实上,对化学信息学的一种定义是“将信息资源混合以将数据转换为信息,将信息转换为知识,其目的是为了在药物先导化合物的识别和优化领域更快地做出决策”。现在,化学信息学正在被应用于化学领域的所有问题。
化学信息学家经常处理大量数据。他们构建信息系统来帮助化学家理解数据,通常试图从数据样本中准确预测化学物质的性质。因此,通过应用信息技术,化学信息学帮助化学家组织和分析已知科学数据,以帮助开发新型化合物、材料和工艺。化学信息学领域的工作人员可能专注于分子建模、化学结构编码和搜索、化学数据可视化或其他几个专业领域。事实上,各种化学结构的计算机图形代码,使我们能够通过计算机查看和搜索化学结构,是由化学信息学家开发的。
化学信息学中使用的方法和工具包括
- 定量构效关系或定量构性关系(QSAR、QSPR)
- 遗传算法
- 统计工具(例如,递归配对)
- 数据分析工具
- 可视化技术
- 化学感知网络语言(CML)。
要成为化学信息学领域有效从业者,需要扎实的化学知识和出色的计算机科学技能。化学和制药公司急需具备这些技能的人才。印第安纳大学信息学院化学信息学研究生课程的课程涵盖以下化学信息学主要方面
- 信息获取:从经验(实验)或理论(分子模拟)中生成和收集数据的方法
- 信息管理:信息存储和检索
- 信息使用:数据分析、关联以及应用于化学和生物化学科学中的问题。
信息获取
信息获取在很大程度上依赖于今天的计算机。随着现代传感器与化学仪器的集成,可以生成的数据量非常庞大。未来的仪器将整合来自现有化学数据库的信息,采用建模技术,并在生成时分析实验数据。这些“智能仪器”将显着提高用户在收集和分析数据时对实验过程做出明智决定的能力。
现在在化学科学领域存在两种互补的生成和收集信息的途径:实验和计算机模拟。传统上,从实验中收集数据是手动完成的,但是随着计算机的开发,计算机足够小,可以被单个实验室购买,术语“化学中的计算机”就出现了,用于描述其使用。几十年前,这个词指的是将计算机连接到像光谱仪或色谱仪这样的实验,并实时收集数据以供存储和以后处理。虽然这仍然在仪器本身内置的微处理器中完成,但一个更全面的标签,用于描述涉及计算机的各种化学活动,是计算化学。
计算化学旨在通过计算方法来定量预测分子和生物分子结构、性质和反应性。它利用现代化学理论来预测未知反应的速度以及最有效地合成复杂新分子的合成序列。计算化学使化学家能够探索事物在原子和分子层面的工作原理,并得出仅通过实验无法达到的结论。因此,计算化学补充了实验得出的数据。
计算化学的一个方面是分子建模。分子建模涉及使用经典和量子力学方法,借助计算机图形,对三维分子结构进行研究。其他分子建模技术包括定量构效关系,它在基于结构的药物设计、相似性搜索和分子形状预测中得到应用。分子建模技术在药物研究中得到了广泛应用,特别是用来预测药效团——分子具有特定生物活性所需的结构特征。分子建模现在被常规地用于生成关于能量学、动力学以及其他无法通过实验获得的分子尺度信息的数据。
组合合成和高通量筛选技术的最新进展现在允许在很短的时间内制备和分析数十万甚至数百万个分子。组合化学技术源于多个学科,包括有机化学、药物化学、物理化学、工程和机器人技术、计算化学、信息学和筛选技术。组合化学中使用的机器人技术为制药行业提供了一个强大的工具,可以用它在过去十年中评估几十个化合物所需时间的一小部分时间内筛选数百万种潜在化合物。组合化学现在在制药领域得到广泛应用,也开始在材料科学领域找到应用。由于组合技术产生了如此多的信息,并从组合技术中收集了如此多的信息,因此存在与存储和检索这些数据相关的并发问题。现在,擅长化学信息学的人正在解决这个问题。
信息管理
用于存储和检索化学数据的许多应用程序都是从化学结构编码和搜索的快速发展中发展而来的。基于结构的应用程序的进步导致了集成化学信息系统——其中越来越多的系统具有 Web 界面——以及专业应用程序,例如实验室信息管理系统 (LIMS)。能够轻松、准确地搜索化学文摘或 Medline 等大型二级数据库,并在原始期刊文献和摘要和索引数据库之间无缝切换,是现代化学信息学研究中真正伟大的成就之一。
化学家已经开发出自己的通信系统(化学命名法和结构系统),这为信息学增添了独特的维度。化学信息学中存在一个以化学结构(二维和三维表示)为中心的活动融合点。二维化学结构数据库已经从传统的化学结构图演变为结构搜索和亚结构搜索系统。在 20 世纪 80 年代后期,人们开始关注三维结构搜索和化学结构的三维表示。描述灵活分子构象空间的完整方法以及相似性搜索技术也得到了发展。这些现在正在被纳入化学信息存储和检索系统。
信息使用
计算机使化学家能够分析和关联来自大型化学和生化数据库的数据,并且当与化学可视化和建模技术相结合时,它正在彻底改变化学研究。信息学技术有助于创建集成信息环境,在该环境中,化学研究和开发的所有方面都可以在一个统一的系统中处理。不仅化学结构可以用作此类系统中的搜索键,还可以使用利用现有化学知识库的化学信息学工具和技术来预测未知性质和光谱。数据挖掘已成为重新评估组织多年来收集的数据的重要因素。化学家现在可以访问以不同格式存储的数十年的原始数据,并获得有用的结果,以此为基础进行过去几年的研究。通过 Web 服务将化学和生命科学数据和信息的许多不同来源整合到一个可用且有用的整体中是印第安纳大学 CICC(化学信息学和网络基础设施合作中心)的主要活动之一。
进一步阅读
Brown, Frank. “Chemoinformatics - a ten year update.” (Editorial opinion) CURRENT OPINION IN DRUG DISCOVERY & DEVELOPMENT May 2005, 8(3), 298-302.
Engel, Thomas. “Basic overview of chemoinformatics.” Journal of Chemical Information and Modeling 2006, 46(6), 2267-2277. DOI: 10.1021/ci600234z
Gasteiger, Johann. “The central role of chemoinformatics.” CHEMOMETRICS AND INTELLIGENT LABORATORY SYSTEMS May 26, 2006, 82(1-2), 200-209 (Special Issue).
Chen, William Lingran. “Chemoinformatics: Past, Present, and Future.” J. Chem. Inf. Model. 2006, 46(6), 2230-2255. DOI: 10.1021/ci060016u