化学信息来源/物理性质搜索
寻找化学和物理性质数据曾经需要翻阅大量的手册、词典和专著。越来越多的主要资源被转换为在线版本。许多图书馆都有权限访问,使读者能够相对轻松地利用这些庞大的经过评估、可靠的数据集。但是,其中许多非常昂贵,因此规模较小的机构可能无法访问。幸运的是,现在有一些优秀的免费数据集合,很容易获得。
数据搜索可以分为四个步骤。第一步是尝试在这些免费集合中找到所需的属性。如果失败,那么许多小型数据集合通常以印刷或在线订阅数据库的形式在许多图书馆中提供。图书馆目录或各种在线指南可以帮助您找到这些资源。接下来,还有大型数据集合,以印刷或在线形式提供,但普及程度较低。最后,可以使用数据库(例如通过 SciFinder 或 STN International 接口的化学文摘、由工程技术学会发布并在多个搜索系统上提供的 INSPEC、来自 Elsevier 的 Compendex(工程索引)或 Google Scholar)来搜索一般文献。只有最后一个数据库是免费提供的。
如果您对开始进行属性搜索感到不知所措,那么有一些优秀的网站可以帮助您入门。一个例子是德克萨斯大学图书馆的 ‘’查找热力学和物理性质数据’’。与其他图书馆提供的资源列表不同,其中一些将在下面提到,而这个列表是该流程的摘要,其中包含建议,甚至还有教程来帮助您入门。
美国国家标准与技术研究院数据库
任何关于数据的讨论都必须包括美国国家标准与技术研究院 (NIST),这个联邦机构负责开发和应用技术、测量和标准。1963 年,美国国家标准参考数据系统 (NSRDS) 成立,由美国国家标准局(现为 NIST)协调。其目的是提供对经过严格评估和整理的定量物理数据的最佳访问。该项目分为七个领域,包括:核性质、原子和分子性质、固态性质、热力学和输运性质、化学动力学、胶体和表面性质以及材料的机械性质。NSRDS 的成果包括专著、活页汇编和计算机磁带。大多数专著都可以在 NIST 的网站上获得。NIST 提供了大量免费的基于网络的数据库,可以通过 NIST 网关 访问。这些数据库提供了对 NIST 科学和技术数据的轻松访问,涵盖了各种物质和性质,包括:溶解度、动力学、光谱和热力学。
这些数据库中最著名的也许是化学网络手册,它提供了对标准参考数据计划和其他贡献者收集的化学和物理性质数据的轻松访问。用户可以通过化学式、化学名称、CAS 登记号、分子量、化学结构和其他概念(如质子亲和力)和反应来搜索化学物质。可获得的数据包括气相和凝聚相热化学、相变;反应热化学;气相离子能;离子簇;红外、质谱、紫外/可见、振动和电子光谱;双原子分子常数;以及亨利定律。大多数数据以表格形式显示,某些数据类型可提供图形视图。所有性质和收集技术都经过了广泛的参考。《NIST 化学网络手册指南》由 Peter J. Linstrom 撰写,包含有关搜索类型和数据展示的详细资料。
其他有用的 NIST 数据库包括
- 陶瓷网络手册
- NIST 化学动力学数据库
- CKMech(化学动力学机理)
- CODATA 基本物理常数
- 烃光谱数据库
- 高温超导材料数据库
- 离子液体数据库(IL Thermo)
- NIST JANAF 热化学表
- IUPAC-NIST 溶解度数据库
- NDRL/NIST 溶液动力学网络数据库
免费 Knovel 数据库
Knovel 提供大量的手册、专著、专著和数据库,将技术信息与分析和搜索工具集成在一起。大多数都是基于订阅的,但是,有一些关键的数据库是免费提供给学术机构的。
《数值数据物理化学技术国际临界表》(第一电子版)
这份经典而著名的参考资料最初于 1926 年至 1930 年间出版,共 7 卷,供美国国家研究委员会使用。它包含了大量关于无机和有机化合物以及纯物质的关键数据。它以物理、热力学、机械和其他关键性质为特色,是化学、物理和工程领域从业者使用的主要参考来源。
2003 年,Knovel 对这份出版物进行了数字化,使其成为可全文搜索的电子格式,便于用户访问数据。7 张最重要的表格被设计为交互式表格,以提高可搜索性和用户友好性。
交互式表格包括
- 化学化合物(无机):B 表
- 化学化合物(有机):C 表
- 液晶表
- 建筑石材表
- 纯糖和糖衍生物的旋光度和熔点表
- 某些纯液体的表面张力数据(0 至 360°)
- 所有类型溶液在所有温度下的表面张力数据表
- 有机物质的溶解热表
- 纯非金属液体电导率表
- 纯液体的粘度表。
Knovel 临界表 第二版
KCT 包含常用化学化合物的物理性质表。第一版包含 6000 种化合物,第二版扩展到 13000 多种。每个表格都是完全交互式的,可以通过关键字和数值属性值进行搜索。热力学表格具有方程式绘图器,可以图形化地表示温度相关关系,并允许轻松计算和绘制性质。这份重要的交互式 Knovel 参考资料包含物理、溶剂和热力学性质表。仅物理性质表就包含 21000 多种无机和有机化合物以及纯物质。溶剂性质表包含 385 种常用溶剂的数据,热力学性质表包含 15000 多种化合物的数据。此外,几个表格使用交互式方程式绘图器来绘制热力学性质随温度的变化图。
数据来源:这些信息是从公开可用的互联网来源和非版权出版物中收集的。Knovel 的内部科学人员对数据进行了审查。如果同一化合物和/或同一性质的值之间存在差异,则对值进行平均或创建范围。
史密森物理表 第 9 版修订版
最初于 1954 年由史密森学会出版社出版,这份经典的参考资料包含 901 张常用物理和化学数据表。提供的信息范围广泛。它对科学家和工程师具有普遍意义,尤其是对那些从事更广义的物理学研究的人员而言。2003 年,Knovel 对这份出版物进行了数字化,使其成为可全文搜索的电子格式,便于用户访问数据。
其他数据库
Matmatch 是一个在线平台,帮助产品设计师和工程师找到、评估和采购材料。该平台拥有一个免费的包含超过 80000 种材料的数据库、直观的搜索工具和供应商列表。
MatWeb 是一个可搜索的数据库,包含超过 86000 种材料的性质。有几个在线工具可用,包括度量单位转换器、重量和惯性矩计算器以及金属和塑料硬度转换器。该数据库包含由制造商和经销商提供的资料和规格表。
有三种类型的搜索:定量、分类和文本。
定量搜索允许您选择材料类别(可选),然后从下拉菜单中选择最多三种属性,或者选择合金类别,然后从下拉菜单中选择最多三种材料成分。要进行高级搜索,您需要注册。
要进行分类搜索,您可以从列表中选择材料类别,也可以通过键入文本术语来选择。您也可以按商品名称和制造商进行搜索。
所有搜索的结果都是一个页面,其中包含各种信息,包括物理、机械、电气、热和加工特性、材料说明以及供应商列表。可用数据量取决于经销商/制造商提供的资料。
ChemSpider 是一个免费的化学数据库,由英国皇家化学学会赞助。截至 2014 年 1 月,它可以访问超过 2900 万种结构,可以通过名称或结构进行搜索,以查找性质、光谱、供应商和文献引用,以及替代名称、SMILES 和 InChIs。
实验性质和计算性质均可用,包括标准性质,如比重;熔点、沸点和闪点;折射率和溶解度;以及外观、稳定性、毒性和安全数据。光谱也可以获得。
ChemIDplus 是美国国立医学图书馆提供的一个免费数据库,包含 350,000 种化学物质。记录包括名称、同义词、CAS 号、分子式、性质以及指向生物医学资源的直接链接。ChemIDplus 可以通过名称、分子量或性质范围以及结构进行搜索。
许多较小的手册和数据库是大家熟知的,并且广泛可用,虽然不是免费的,但如果免费资源无法提供所需信息,这些资源就可以派上用场。许多手册都有印刷版。
经典的 CRC 手册仍然以印刷形式出版,但现在也以 CDROM 和网络形式出版。除了大家熟悉的目录或索引之外,在线版本还可以使用基本的关键字搜索或结构/属性搜索进行搜索。数据可以显示为静态 pdf 或交互式表格,可以对这些表格进行排序、打印和/或导出。搜索帮助可以轻松地从目录窗口访问。在线版本只包含最新版本的表格,尽管它包含指向早期版本中已停产表格的链接。
Chapman & Hall 公司最初出版了一系列以“...... 词典”开头的印刷和 CD-ROM 产品。这些作品实际上是数据汇编或更大的手册。信息包括关于化学、物理和生物性质化合物的描述性数据和数值数据;化合物的系统名称和通用名称;文献参考;结构图及其相关的连接表。特别是“有机化合物词典”的显著特点是物质的结构描述以及衍生物的性质,以及对化合物合成、光谱等的原始文献的引用。这些现在可以从 CRC CHEMnetBase 在线获取。所有词典都可以在一个数据库中使用,即“综合化学词典”,涵盖以下内容:
- 分析试剂词典 (14,000 种化合物)
- 碳水化合物词典 (24,000 种化合物)
- 药物词典 (50,000 种化合物)
- 无机和有机金属化合物词典 (106,000 种化合物)
- 天然产物词典 (226,000 种化合物)
- 有机化合物词典 (292,000 种化合物)
一般来说,CCD 包含以下化合物:结构简单的基本有机和无机化合物,包括元素、无机二元和三元化合物(氢化物、卤化物、氧化物、硫化物);几乎所有已知的天然产物,包括结构未知的天然产物;所有目前上市的药物,包括所有列在通用名称汇编中的药物;具有既定用途的化合物,如催化剂、溶剂、起始原料、合成试剂、分析试剂;重要的配位化合物,例如胺类、膦类、烷氧基络合物和主要已知的生物无机化合物;代表所有重要结构类型的有机金属化合物(在具有有机取代基的配体的情况下,通常是每个系列的母体成员,如果已知,连同选定的同系物);重要的生化物质和矿物质;以及由于其化学、结构或生物性质而特别重要的其他化合物,包括许多新合成的具有活跃研究兴趣的化合物。
CHEMnetBASE 中包含的其他数据库包括
- 有机化合物性质,这是《有机化合物性质手册》的在线版本,该数据库涵盖了 27,000 多种有机化合物,可以按结构进行搜索。除了印刷版之外,还提供 CD 版。
- 聚合物:一个性质数据库,它提供了关于 900 多种聚合物的科学和商业信息。包括材料类别和聚合物类型信息,以及各种性质,如容积和量热性质、表面和溶解性、传输、机械、电气、光学和稳定性。
默克索引 (默克雪兰诺/英国皇家化学会)
印刷版的默克索引,现在是第 15 版,仍然在许多图书馆和实验室中可以使用。在线版本可以通过数据库供应商(如 Dialog)、聚合器(如 Knovel)以及其他公司(如 CambridgeSoft)获取。英国皇家化学会是新版印刷版的出版商,也是在线版本在美国和加拿大的授权提供商。虽然默克的重点是医药领域,但它还涵盖了许多其他生物活性化合物和重要的工业化合物,包括
- 人用药和兽用药
- 生物技术药物和单克隆抗体
- 用于医学成像的物质
- 生物制品和天然产物
- 植物和草药
- 农业化学品(包括杀虫剂和除草剂)
- 商业和研究中使用的有机和无机化学品
- 实验室试剂和催化剂
- 染料、颜料和指示剂
- 环境重要物质
在线版本可以通过名称、CAS 登记号、分子式和分子量以及其他功能进行搜索。Knovel 和 Cambridgesoft 版本也可以通过结构进行搜索。
Knovel 是一个基于网络的应用程序,将技术信息与分析和搜索工具集成在一起。Knovel 的三个关键要素——经过验证的内容、优化的搜索和数据分析工具——使研究人员不仅可以轻松找到相关数据,还可以分析、记录并将这些数据融入日常工作。该资源是一个可搜索的数据库,包含来自 70 多家科学和工程出版商(包括 26 个主题领域的领先学会)的数千本手册和参考资源。虽然工程,更普遍地说,应用科学是 Knovel 的主要关注点,但也包括:生物化学、生物学和生物技术;化学和化工;食品科学;纳米技术;制药、化妆品和洗涤用品;以及纺织品。Knovel 的独特方法提供了许多优势,包括以下这些功能:
- 独特的搜索功能——快速访问相关可靠的技术内容
- 交互式工具——交互式图形、表格和方程式为您提供独特的教学和学习机会
注意:在过去几年里,一些主要的出版商,特别是 Wiley、Springer 和 McGraw-Hill,选择从 Knowel 中撤回他们的内容,更倾向于在他们自己的平台上提供这些内容。例如,170 本 McGraw-Hill 手册被撤回,访问权转移到 McGraw-Hill 自己的平台 Access Engineering 上。其中包括一些经典的资源,例如 Perry 的化工工程师手册、Lange 的化学手册和化学性质手册。然而,Knovel 一直积极寻求从其他出版商那里获得替代内容,尽可能地做到这一点。
Knovel 继续提供许多宝贵的数据来源,包括
- 物理性质设计研究所的 DIPPR 项目 801
- 聚合物手册
- 聚合物数据手册
- 来自大型 Landolt-Bornstein 表格的几卷
- 默克索引
订阅者可以选择所有标题、部分主题领域或单个标题,因此并非所有订阅机构都可以访问所有相同资源。
印刷手册和论著
除了上面提到的与在线版本相结合的一些印刷资源之外,还有许多其他单卷和多卷手册和论著。这些可以通过在图书馆目录中搜索标题或通过搜索所需属性加上子标题(如表格或手册)来找到。还有一些由大学图书馆编制的性质指南。一些代表性的指南包括
有三个主要的参考集合具有重要的历史意义,它们至今仍然存在于图书馆以及在线版本中。这三个集合都起源于德国,这使得印刷版本的使用经常变得困难和令人沮丧,尽管这三个集合都包含大量可靠的数据。在线版本非常昂贵,可能不容易获得。
Landolt-Bornstein
Landolt-Börnstein (简称 L-B) 是现今现存规模最大的印刷版、经过严格评估的数值数据汇编,包含 400 多卷。它涵盖了化学家感兴趣的许多领域,但由于早期的版本是德语,因此限制了其在美国的使用。现在有英语的主题和化学物质索引,可以帮助在该套书的许多卷中找到感兴趣的表格。尽管从 1996 年开始出现 CD-ROM 版本的索引(包括《有机化合物索引》),但印刷版 L-B 仍然是一个具有挑战性的集合。必须仔细注意表格和章节注释、索引以及对单位、文献参考等使用的代码和缩略语的解释。必须检查每个表格、章节、篇章和卷的开头和结尾部分,以了解数据的表示方式。
Landolt-Bornstein 中的数据涵盖
- 基本粒子、原子核和原子
- 分子和自由基
- 凝聚态物质
- 物理化学
- 地球物理学
- 天文学和天体物理学
- 生物物理学。
现在有一个 L-B 的订阅数据库版本,称为SpringerMaterials。除了 L-B 表格之外,该资源还包括多特蒙德数据银行软件与分离技术、热物理性质数据库、莱纳斯·鲍林文件、无机固相数据库以及化学安全数据。英语的L-B 物质/性质索引可以在网络上免费搜索,可以通过精确名称或名称的一部分、CAS 号、分子式或分子量范围(例如,50-150)以及其他选项进行搜索。这至少允许搜索者确定哪些化合物、可用的数据以及这些数据在卷结构中的位置,尽管访问实际数据需要订阅或使用印刷版。
Reaxys(贝斯特林有机化学手册及相关数据库)如果您需要查找有机物质的物理性质或二维结构图,印刷版的《贝斯特林有机化学手册》或爱思唯尔的Reaxys数据库(包含贝斯特林数据库,以及专利数据库,新添加的数据和无机/有机金属化学手册——格迈林手册,见下文)是您绝佳的选择。这一庞大的资源是迄今为止有机化学领域最重要的数据收集。贝斯特林涵盖了从18世纪末/19世纪初到现在的有机化学发展史。早期版本为德语,而后期版本则为英语。贝斯特林电子版的出现将这些宝贵数据带到了更广泛的受众面前。尽管印刷版的覆盖范围已远远落后于当前日期,但该数据库的时效性却非常不错,几乎可以覆盖到当年最新的文献。印刷版已不再出版。随着更加用户友好的电子版的出现,许多机构将印刷版移交到仓库进行保存。不过,印刷版仍然可以找到。您可以从布法罗大学图书馆获取关于使用印刷版的实用指南:2010年底,贝斯特林名称被弃用,该资源现已完全更名为Reaxys,并由少数其他供应商更新和授权。Reaxys中报告了数十种物理性质,所有数值均为原始出版物中报告的实验值。如今,该数据库中包含超过3亿条科学测量数据。Reaxys数据库可以根据特定性质或性质数值范围进行搜索,因此在搜索具有特定物理性质的有机材料时特别有用。想象一下,结合对数据库中数百万种化合物进行精确结构或亚结构搜索的能力,这项功能将多么强大。
Reaxys数据库包含超过3.2亿条关于化合物的实验数据,其中包括以下信息类型:
- 分子式和结构式
- 历史
- 形成
- 制备
- 物理性质
- 化学反应
- 应用
- 化学行为
- 光谱信息
- 加合物和盐
- 未知结构的转化产物
- 药理学数据
- 生物活性数据
- 量子化学数据
格迈林无机和有机金属化学手册
如上所述,Reaxys还包含了来自贝斯特林的“姊妹出版物”——《格迈林无机和有机金属化学手册》的大部分内容。格迈林与贝斯特林拥有相同的全面性,是无机和有机金属化合物信息和数据的最大单一来源。关于贝斯特林的许多说法也适用于格迈林。它最初以德语出版,后来的版本则以英语出版,目前已不再印刷出版。所有更新都包含在Reaxys中。
格迈林的编排是以元素为基础的。信息包括:
- 元素本身的讨论
- 其与格迈林系统中编号较低的物质形成的二元化合物
- 包含两种以上元素的化合物
对于给定的物质,格迈林提供了关于其存在形式、制备方法、物理性质和化学性质的信息。
Reaxys数据库对格迈林手册1975年以前出版版本中的特定化合物信息进行了索引。大多数散文部分(例如元素的历史)和图形信息(例如相图、X射线结构)尽管经常被引用,但并非Reaxys数据结构的一部分。因此,对于格迈林来说,定期使用印刷版和在线数据库至关重要。
从1976年开始,格迈林开始索引无机和有机金属化学领域最重要的120种期刊(目前约60种)。此后,索引范围有所扩大。
期刊文章似乎是物理性质数据的绝佳来源,对于常规报告的标准数据来说确实如此。问题在于,期刊文章中包含的物理性质数据并不总是被摘录和索引服务一致地索引。有些期刊专门设计用于发表数据。其中两个是《物理化学参考数据期刊》(1972-)和《化学与工程数据期刊》(1956-)。这些期刊可以通过出版社网站或使用以下提到的索引进行搜索。
一种在期刊文章中查找数据的技巧是执行包含文章摘要中的关键词的搜索,例如通过STN上的CAPLUS文件或SciFinder、INSPEC或Compendex等文献数据库进行搜索。
化学文摘
除了索引期刊文章中的数据信息之外,化学文摘庞大的物质数据库(REGISTRY文件)最近也通过添加实验数据和光谱而得到了丰富,这些数据来自化学文摘社从文献中挖掘而来,或来自从其他供应商那里获得许可的属性数据库。这些数据现在已附加到大多数化学物质的物质记录中,以及使用ACD程序得出的许多计算属性。REGISTRY文件不仅包含人们期望在大型手册中找到的常见物理性质,还包含许多对制药行业或生物科学家感兴趣的性质。例如,生物浓缩因子、可自由旋转键的数量、分子中氢键供体或受体的数量、LogP等。
使用SciFinder,化学文摘信息的热门接口之一,可以在任何三种模式下进行搜索,即研究主题、物质或反应,可以使用化学名称、分子式、CAS登记号或结构。STN和其他供应商版本的化学文摘可以根据其协议进行搜索。检索到的文章将包含指向文章中提到的所有物质记录的链接。显示完整的物质记录将给出所有实验和计算属性的完整列表。
其他数据库
INSPEC和Compendex也可以作为查找属性的有用数据库。两者主要包含物理、工程和应用科学领域的期刊文章。这些文章可能富含数据。特殊的搜索功能使查找此类信息变得更加容易。例如,INSPEC具有分类代码和数值数据索引,可以帮助用户专注于属性,甚至属性范围。
出版社网站
另一种技巧是搜索期刊电子版的全文文件。大多数出版社都有自己的搜索引擎,这些搜索引擎可能很有用,但使用它们会将你限制在特定出版社的产出范围内。随着越来越多的科学期刊以电子格式发布,这将成为一种越来越重要的方法,尤其是在程序员、研究人员和供应商找到更多创新的方式跨期刊标题进行搜索时。一旦你找到感兴趣的文章,许多出版社会提供指向这些文章中引用的其他文章的链接,无论这些文章发表在何处。将支持信息(通常是数据和实验步骤)以缩微形式发布的做法使得这些信息难以找到,因为它并不总是被索引。现在,这些补充信息正在与文章一起发布到网上。美国化学学会(ACS)是一个例子,他们现在正在其网站上提供补充信息以及相关文章的全文。
谷歌和谷歌学术搜索
除了网络上的期刊文章之外,还有很多生产商和经销商的信息可用。尽管谷歌搜索可能会返回大量无关或不可靠的信息,但也可以从供应商(如Sigma-Aldrich)的目录或材料安全数据表中获得良好的数据。Ben Wagner的文章对这些资源中的一部分进行了详细讨论。A. Ben Wagner, (2001). "Finding Physical Properties of Chemicals", Science & Technology Libraries, 21:3-4, 27-45。有一个修订版使网站列表更加更新。
请记住,当查阅不同的来源时,你可能会发现物理性质的值不同。一般来说,大型致力于数据生产和分析的组织(例如美国国家标准与技术研究院和信息分析中心)的数据更可靠,经过严格评估。尽可能地寻找最大、最权威的数据来源,并在怀疑存在转录错误时查阅原始期刊文章。
其他资源
Wagner, A. Ben. 2014. “Physical Properties and Spectra,” in Chemical Information for Chemists: A Primer. Currano, Judith & Roth, Dana (Eds.), Cambridge, UK: Royal Society of Chemistry, 146-183.