化学信息来源/作者和引文检索
本章涵盖了直接作者检索和引文检索,即检索引用特定文章或作者出版物的论文。作者检索,无论是针对个人还是公司,似乎很简单,但常常会因拼写错误、姓名变更、音译和文化差异以及姓名的变体形式而变得复杂。作者本人有时也会在不同的论文中以不一致的方式格式化自己的姓名,并使用昵称(Jim/James)、中间首字母或完整的中间名,或者完全省略一个或多个中间名。尽管一些文化中婚后将娘家姓改为夫姓的情况现在不那么普遍了,但这已被处理复合连字符姓氏的复杂情况所取代。一些文化中的习俗是将姓(家族名)放在前面,而许多西方文化称之为“名字”的名称放在后面。这几乎总是导致出版物以两种顺序出现在期刊和数据库中,例如,Tilak Bommaraju 和 Bommaraju Tilak。
正如任何商业搜索人员都可以证明的那样,搜索公司名称会带来另一组挑战,尤其是由收购和合并引起的名称变更。公司作者可能以直接子公司名称列出,但并非最终母公司,而最终母公司可能在链条上高出 1-3 级。知名的部门和中心可能列出时没有任何关于母体实体的参考,例如,国家职业安全与健康研究所,它隶属于疾病控制与预防中心,而疾病控制与预防中心本身又隶属于卫生与公众服务部。再加上私营和公共实体的首字母缩略词的盛行,以及将长期使用的首字母缩略词在某个时候定为官方名称的趋势,人们就会开始了解所涉及的挑战。建议咨询一位优秀的商业搜索指南或商业图书馆员。
一旦确定了作者姓名所有可能的变体,就需要将其转换为格式正确的搜索查询,并为计划搜索的每个系统选择合适的字段/字段代码。将搜索限制在个人作者字段或公司来源字段将有助于消除错误的匹配,例如“wood”,它可以是关键词或作者的姓氏。Web 系统通常会提供一个标记为“作者”的框,可以填写该框。
姓名输入顺序、标点符号以及一些数据库中是否必须完全按照在文件中找到的名称输入姓名,是您在在线数据库中进行作者检索之前需要了解的关键点。著名化学家 Paul von Rague Schleyer 在 1997 年 3 月 23 日给 CHMINF-L 的一封便条中感叹道:“我在 SCI [科学引文索引] 中被列出了 17 种不同的方式,直到我投诉才被纠正!... 在 CAS 中搜索我的出版物只会找到一半。”虽然人们有时会提出建立作者登记处的建议,类似于 CAS 的化学登记系统,但迄今为止,还没有任何摘要或索引服务在这方面采取行动。在开始搜索之前,了解所用服务的作者姓名处理方式仍然非常重要。
就印刷作品而言,即使是在非常古老的化学文献中也能找到作者索引。出版商通常会在期刊卷或出版年份的末尾创建作者索引,以便轻松访问在该期刊中发表的文章。一些甚至会编制涵盖期刊出版十年或更长时间的索引,其中肯定会包含作者索引。例如,伦敦皇家学会的十年索引(1971-1980 年),它是一个索引,涵盖了他们在《会议记录》、《哲学汇刊》和《传记回忆录》出版物中的作者。化学文摘社还为从 1907 年创刊以来的印刷版《化学文摘》出版了五年或十年一卷的作者合集索引。
百科全书文章末尾的参考文献通常是您在某个领域开始研究时获得该领域关键人物的良好来源。作者索引可以在摘要和索引期刊、参考文献、综述期刊以及许多其他二手作品中找到。在某些情况下,寻找一家公司作为作者可能是有价值的。公司名称是如何(甚至是否)索引将取决于数据库。对于非常常见的个人姓名,有时将个人作者姓名搜索与该作者在发表时工作的公司名称结合起来是很有用的。
在本章中,我们将介绍科学网(包括科学引文索引),并解释科学引文索引(SCI)的跨学科性质,该工具是由尤金·加菲尔德博士发明的。为了涵盖数据库中的新条目,SCI 只包括最重要的科学期刊,但当搜索已知引文时,过去任何时间发表的任何类型的文档都可能在新的期刊文章中被引用,从而成为 SCI 引文检索中的搜索关键词。对于化学文摘数据库,包括了几种不同类型的原始文档(期刊文章、技术报告、论文、专利、会议论文集)。借助 SciFinder,现在可以相对轻松地对 CA 文件进行作者检索,并且还可以对过去十年或更长时间发表的文档进行引文检索。
如今,在大多数科学学科中,很少能找到由单个科学家撰写的文章。因此,一篇文章可能列出了 3、5、10 或甚至更多作者。一篇文章的作者数量远超 100 人的记录!摘要和索引期刊通常会限制他们在印刷版作者索引或数据库中包含的特定文章的作者姓名数量,而 SCI 也不例外。“来源索引”最多涵盖九位作者。随着计算机环境的不断发展,这些限制正在逐渐消失。SCI 数据库现在包括其科学网版本中的所有作者,而化学文摘社在 1996 年以前作者数量的限制为十位,从 1997 年开始将限制提高到了 150 位。SCI 仅使用作者姓名的首字母,这有时会导致检索到与大卫·威廉姆斯等常见名称无关的参考文献。化学文摘社通常会将作者的姓名完全按照原始文档中的显示进行输入。
与按个人姓名进行作者检索相关的特定搜索类型是 引文检索。在这种情况下,会使用出现在新文献参考文献中的已知作者作品的参考文献来识别这些新文献。换句话说,创建引文索引是为了在已知与您感兴趣的主题相关的较旧的被引用作品和较新的引用作品之间建立联系。假设只有当最近的文章与较旧的文章主题相同的情况下,才会引用较旧的文章。
多年来,科学信息研究所(ISI;现已并入汤森路透)出版了《科学引文索引》(SCI),其印刷版格式(现在也包括在科学网上)可以追溯到 1900 年。完整的印刷版 SCI 是一个多学科索引,涵盖了全世界最重要的科学和技术期刊(约 5,000 种)。
SCI 涵盖了 1900 年至今发表的文献,并按作者在“来源索引”中索引,该索引是 SCI 的一部分。可以将“来源索引”视为在索引发布时新文献的作者索引。由于 SCI 包含所有科学领域最重要的期刊,因此它应该是搜索任何科学家出版物的首选来源之一。
SCI 真正独特之处在于,每一卷都包含一个“引文索引”,实际上将 SCI 的涵盖范围扩展到了 1900 年以前。因此,即使一篇文章是在 1873 年撰写的,只要有人在 1900 年之后被 SCI 涵盖的期刊中引用过它,较旧文章中的参考文献就会提供到较新的引用文章的链接。
SCI 还包含主题索引,我们将在后面的章节中讨论。
印刷版科学引文索引的累积版出版于以下年份
Source Permuterm Citation Years Index Subject Index Index 1945-54 x x 1955-64 x x 1965-69 x x x 1970-74 x x x 1975-79 x x x 1980-84 x x x 1985-89 x x x etc.
印刷版《科学引文索引》中的所有信息现在都可以在科学网 SCI 数据库中找到。《科学引文索引》的在线版本也同时在 DIALOG 和 STN 国际上提供,被称为 SciSearch。参见 STN SciSearch 记录示例。
单个文章中的多个作者的问题在于,只能列出一位作者作为第一作者。因此,SCI 的“引文索引”将使用列出的第一作者作为进入“引文索引”的入口点,即使第一作者不是论文中列出的最杰出的科学家(主要作者)。这是一种合理的方法,因为大多数在参考文献中遇到该出版物的人会看到它被引用时与它在期刊中出现的完全一样。但是,考虑一下当您想找出有多少人引用了特定科学家共同创作的所有出版物时,这会导致的问题。如果在一个人的职业生涯中,曾有过该科学家没有被列为第一作者的情况,则意味着您必须将这些单独的参考文献中的每一个用作单独的搜索关键词,才能找到所有引用过该科学家作品的文章。这在印刷版 SCI 中是一项非常乏味的工作,并且直到最近在数据库中也不容易。然而,这通常是一项人们为了支持晋升和任期案件、确定特定研究领域的年轻研究人员等目的而希望执行的任务。
SCI 的网络版本于 1997 年出现(也涵盖了 1900 年以来的新来源材料)。它被称为 Web of Science,现在是汤森路透的 Web of Knowledge 的一部分。该版本的科学引文索引包含许多文章的摘要,并且从 1997 年开始包含作者的电子邮件地址。网络版本最强大的功能之一是能够找到大多数作者的期刊出版物的引用,即使该作者未被列为出版物的第一作者。[这些文章必须发表在 Web of Science 版科学引文索引涵盖的 5700 多种期刊中之一。]
Web of Science 的科学引文索引上的示例引文搜索
[edit | edit source]让我们看看如何搜索引用了 David E. Clemmer 博士 1995 年发表的文章。该出版物是
Clemmer, D.E; Hudgins, R.R.; Jarrold, M.F. 裸露蛋白质构象:气相中的细胞色素 c。J. Am. Chem. Soc. 1995, 117, 10,141-10,142.
是的,那篇文章从第 10,141 页开始!JACS 是一本庞大的期刊,与大多数科学期刊一样,全年页面编号连续。
步骤 1:使用 Web of Science 格式以最少的信息输入引文搜索
- CitedAuthor:Clemmer DE
- Cited Work:J AM CHEM SOC
- Cited Year(S):1995
- 并执行“搜索”以查看该作品是否已被任何人引用。
步骤 2:查看搜索找到的参考资料,特别注意明显打字错误的变体形式。请注意,一些查找候选人只有一个引用(“命中”)。当条目创建时,页码(1014 和 1041 而不是 10141)很可能存在打字错误。
另一个表明这些是错误的线索是,尽管 Clemmer 博士是第一作者,美国化学学会期刊是 SCI 在来源索引中涵盖的期刊之一,但文章摘要没有超链接到引文。
步骤 3:检查具有正确引文的命中,并“完成搜索”。
步骤 4:随机选择结果首页上的一个参考。这是最近引用原始 1995 年文章的文章之一
步骤 5:查看 Web of Science 中的完整记录,包括摘要。
注意右侧边框中的“相关记录”部分。这些记录至少包含一个与文档共享的引文。相关记录功能也存在于 STN 的 SciSearch 上,在该功能上可以搜索到 1974 年。同样,请注意 SCI 提供作者地址。假设作者在文章发表后没有搬迁,这是一个查找该信息的理想地点。
STN 国际上的 SciSearch
[edit | edit source]现在可以在 STN 的 SciSearch(或 Web of Science,如上例所示)上进行搜索,并进行相当全面的工作,以查找 SCI 涵盖的所有引用了特定作者出版物的出版物。在 STN 上,这是使用 SELECT CIT 功能作为从允许进行全面作者搜索的数据库的桥梁来完成的。例如,我们可以在 STN 的 CA 文件中对 Ernest R. Davidson 的出版物进行作者搜索,并找到他自 1967 年以来出版的所有内容,这些内容包含在答案集 L4 中。STN 上 SmartSELECT 功能的搜索算法将从答案集 L4 中提取相关的搜索关键字,并在输入以下命令时在 SciSearch 中运行搜索
=> FILE SCISEARCH
=> S L4<CIT>
Chuck Huber 在 2006 年 9 月 26 日在 Scholartalk 上发布了这个分步程序,Scholartalk 是 CAS 为 SciFinder Scholar 管理员提供的封闭循环讨论列表
1) 在 CAPLUS、SCISEARCH 和/或其他适当的数据库中搜索您的作者的出版物。
2) 使用 DUPLICATE 命令从组合的答案集中删除重复项。
3) 使用 SELECT CIT 创建一组引文搜索关键字。
4) 搜索结果 E# 在 CAPLUS 和 SCISEARCH 中以找到一组引用参考。对答案集进行重复数据删除,您将获得引用的最终数量。
5) 如果您的作者想知道是谁引用了,或者年份分布,或者引用了哪些文章,请使用 ANALYZE 命令生成作者或出版年份或命中参考的表格。
警告:这种方法虽然快速且(相对)便宜,但会错过大部分错误引用(错误的被引用作者、错误的卷号、错误的页码、错误的出版年份),因此引文总数会偏低。
公司或组织名称搜索
[edit | edit source]可以在 SciSearch 中执行“公司来源索引”上的搜索。例如,在 STN 上,搜索语句
=> S DOW FREEPORT/CS
将产生道化学公司弗里波特分公司研究人员的出版物。
如以下所示,也可以在 Web of Science 上进行公司搜索。常规搜索包括一个地址选项,可以输入地理地名和邮政编码,以及公司名称中的词语。在下面的示例中,我们正在寻找印第安纳州布卢明顿(邮编 = 47405)印第安纳大学化学系人员发表的所有文章。请注意使用相同的运算符以将所有词语保留在同一个逻辑单元(句子)中。但是,这种方法显然不会涵盖教师访问另一个机构(例如,在休假期间)并从该位置发表文章的情况。
在 Web of Science 搜索页面上,在搜索框中键入“Indiana SAME Chem SAME 47405”,然后从下拉菜单中选择地址。
印刷版化学文摘中的作者和公司搜索
[edit | edit source]可以搜索印刷版化学文摘(CA)一直追溯到 1907 年,并且整个时期都有作者索引。实际上,化学文摘的五年和十年累计索引使作者搜索变得容易。
要有效地使用印刷版 CA 作者索引,您必须知道,即使索引中列出了全名,但名称的字母顺序排列仅考虑了名字的首字母(名字和中间名)。因此,我们在索引中发现以下名称顺序
Davidson, Eugene Abraham
Davidson, Ernest Roy
Davidson, Elizabeth West
这与如果所有名称的所有部分的所有字母都包含在字母顺序中所期望的结果完全相反。确定姓名在化学文摘作者索引中的位置还有许多其他规则,您可以参考该作品本身以了解这些规则。
CA 的涵盖范围远不止科学和技术期刊(自第二次世界大战以来的大部分时期内,期刊数量是科学引文索引的两倍多)。它还涵盖论文、会议论文集、报告、专利、技术报告和其他主要文献。1995 年,化学文摘社开始在 CAPlus 文件中包含电子期刊文章的条目。
CA 中发现的一种特殊类型的作者条目是专利权人,即申请并获得专利的人。CAS 还索引专利受让人,通常是专利权人工作所在公司。专利权人不在科学引文索引的“来源索引”中找到,因为该产品仅涵盖主要期刊,但专利约占每年添加到 CA 数据库的文档的 1/6。在印刷版CA 索引中,字母“P”插入卷号和作者索引中的摘要号之间以指示文档是专利,例如
103:P160286w.
公司机构也在 CA 作者索引中被索引。请记住,包含人名的公司将在印刷版作者索引中反转名称,例如“Lilly, Eli, and Co.”。
CAS 数据库中的作者搜索
[edit | edit source]SciFinder 中的“作者姓名”搜索选项是主要的搜索探索选项之一,它也是在产品上以其他方式搜索后细化检索到的答案集的一种选择。
印刷版 CA 的归档习惯通常不会在 STN 或其他版本的 CA 数据库中出现问题。在 SciFinder 中,算法会找到与搜索条件匹配的可能候选人。如果您搜索作者“Hieftje, G M”,并且选中了查找姓氏的替代拼写前面的框,搜索引擎将找到“Hieftje”的拼写错误,如“Heiftje”。(但是,它可能不会找到诸如“Hleftje”之类的打字错误。)
几年前,化学文摘社将引文搜索引入了 SciFinder 产品线。现在可以通过使用“引用参考”选项细化搜索来查找 1997 年至今发表的新文章。例如,假设您想知道 1997 年或之后发表的哪些文章引用了 Gary M. Hieftje 博士 1994 年发表的文章
Wu, Min; Madrid, Yolanda; Auxier, Jake A.; Hieftje, Gary M.. 流动注射等离子体发射光谱法的新型雾室。Analytica Chimica Acta (1994), 286(2), 155-67. CODEN: ACACAM ISSN:0003-2670. CAN 120:234885 AN 1994:234885 CAPLUS
当您查看该条目的完整记录时,点击记录顶部的“获取引用”选项。然后,您将在下一页获得引用原始文章的新文章。
Reaxys 中的作者搜索
[edit | edit source]Reaxys 数据库涵盖了有机化学文献,最早可以追溯到18世纪的最后三分之一。因此,它是化学文摘和科学引文索引数据库的有用补充。但是,该文件并非真正为作者搜索而设计,因此必须谨慎地包含可能为所需作者的姓名,即使只在数据库中输入了姓氏。(在**文献数据**部分搜索**作者**)
某些专利数据库使用代码表示公司名称(专利受让人代码)。例如,德温特的全球专利索引为全球约 21,000 家拥有 50 项或更多专利的公司分配了代码。母公司、子公司和相关公司均会被检索到。对于罗氏公司,代码为 39424。
NLM 的 PubMed(Medline 数据库的一个版本)包含“相关文献”。虽然与真正的引文搜索略有不同,但效果类似。
可以使用 CiteSeer 进行公共领域引文搜索。CiteSeer 通过搜索已发布在 Web 上的科学文章版本来创建数字图书馆。
自 19 世纪以来,科学期刊文章的作者搜索一直可用。几乎所有摘要或索引服务以及大多数其他类型的二手文献都提供作者搜索功能。许多服务甚至允许您搜索公司或其他机构。查找新期刊文献的独特方法是进行引文搜索,使用来自感兴趣的较旧文档的文献信息。