跳转到内容

图书馆与信息科学/信息组织简介

来自维基教科书,开放世界中的开放书籍


阅读完本章后,学生应该能够表达

  1. 如何建立有效的参考文献
  2. 图书馆如何共享编目记录
  3. MARC记录的目的和结构
  4. FRBR 概念模型
  5. 信息架构领域的基本概念
  6. 几种主要分类策略的优势
  7. 语义网和链接数据的概念
  8. 对信息组织实践的主要批评

为什么组织信息?

[编辑 | 编辑源代码]

互联网上大量的信息资源导致了有限的用户注意力和对搜索引擎等门户服务的依赖。这些门户服务利用用户注意力的稀缺性,将用户的注意力引导到某些文档,而远离其他文档。[1]

参考文献

[编辑 | 编辑源代码]

玛西娅·贝茨试图以一种对最终用户来说清晰的方式定义和规范系统参考文献,使其能够清楚地了解此类参考文献涵盖的内容,以及如何让研究更轻松,并使参考文献成为搜索策略中的更有价值的工具。作者始终关注最终用户和参考文献在现实世界中的应用。参考文献的“定义目的”的概念贯穿整篇文章,而对参考文献的 主要规范进行了详细的讨论,包括:

  1. 范围
  2. 选择原则
  3. 组织
  4. 领域
  5. 信息领域
  6. 书目单元

对选择原则给予了特别的关注,即选择文章用于特定参考文献的方式。这些原则是:

  1. 专家判断
  2. 随机样本
  3. 代表性样本
  4. 功能等价集

我同意文章中陈述的概念以及在构建参考文献时采用某种系统结构的必要性,以便用户能够获得他们需要的信息,并确信参考文献中提供的材料是全面的、相关的和完整的,正如参考文献的目的陈述所定义的那样。我认为这是一篇非常棒的文章,因为它详细地逐步说明了如何构建一个始终将最终用户的搜索策略纳入考虑的系统参考文献。

阅读这篇文章让我不禁思考数字资源的使用是否改变了参考文献的编制方式。[2]

主题指南

[编辑 | 编辑源代码]

书目元数据

[编辑 | 编辑源代码]
图书馆旧卡片目录中的一张手写主题卡片让人想起计算机出现之前的时代,当时信息需要手工创建、分类和排序。

编目是将项目添加到目录中的过程,这个过程通常包括书目描述、主题分析和分类。

权威控制

[编辑 | 编辑源代码]

MARC格式

[编辑 | 编辑源代码]

MARC格式是美国国会图书馆在20世纪60年代开发的用于描述书目项目的数字格式,旨在促进图书馆之间编目的创建和传播。虽然这些格式最初是为了促进纸质卡片目录的印刷而创建的,但它们至今仍在用作大多数计算机化图书馆目录的基础。

杰基·拉德博表示,MARC格式将在全球数字通信时代生存下来。她描述了对MARC进行的修改,以适应不同类型的材料,使网页地址可以从MARC访问,以及从MARC记录中访问在线目录。MARC 21目前在世界上的许多国家使用。MARC文档已翻译成多种语言。目前的修改包括将MARC映射到多种语言,以及与Dublin Core、SGML和XML映射,以使MARC适应基于网络的环境。在进行网络使用修改之后,它仍然是MARC吗?拉德博引用了2000年ALA大会上的一位演讲者的话,他表示MARC仍然非常活跃。在同一次会议上,推动了MARC并使其取得巨大成功的弗雷德·基尔戈尔推测,在未来30年里,MARC将被取代。在我看来,MARC一直是一个很有弹性的格式,但可能会被更能适应数字环境的格式所取代。[3]

书目框架 (BIBFRAME)

[编辑 | 编辑源代码]

包括未来书目控制工作组和美国RDA测试协调委员会在内的几个专家组建议图书馆界实施一个新的书目数据载体,以取代MARC标准。RDA测试委员会的最终报告建议,除非在捕获和共享书目数据的新方法之上实施新的编目方法,否则不太可能产生重大的好处。换句话说,许多专家认为,MARC格式阻碍了更好的编目实践的发展。

新的书目框架的总体计划列出了对新载体的若干要求,该载体被描述为“环境”而不是简单的“格式”。一些最值得注意的要求是,新环境将支持以文本数据和链接数据 URI 形式表达的书目描述;兼容 RDA、AACR2、DACS、VRA Core 和 CCO 描述规则;并为支持或伴随书目数据的 数据提供条款,例如权威数据、馆藏数据、保存数据和技术数据。该计划还指出,编目员可能以比当前与 MARC 交互更抽象的级别与新的数据载体交互。BIBFRAME 的方法基于来自链接数据社区的 RDF 数据模型,该模型已经开发了许多查询和存储工具。[4]

书目记录的功能要求

[编辑 | 编辑源代码]
Four different entities (Works, Expressions, Manifestations, and Items) are shown, along with their relationships. Expressions are described as the realizations of Works, Manifestations as the embodiments of Expressions, and Items as the exemplars of Manifestations.
FRBR 第一组实体及其相互之间的关系。

从历史上看,编目实践一直致力于描述“书籍”。早期的国际标准化编目实践尝试,例如 1961 年的巴黎原则,只涉及印刷书籍的编目。巴黎原则将自身描述为仅适用于“在作者姓名下编目,以及在这些姓名不适合或不足的情况下,在作品标题下编目的印刷书籍目录,这些目录以一个字母顺序排列”。1[5] 即使在 1961 年,图书馆也为其用户提供除印刷书籍以外的材料,例如期刊和音乐录音,并且图书馆编目员被要求描述的格式数量自那时以来一直在增长。当代图书馆目录可能包括参考数据库、电子书、DVD、计算机软件、网站、博客、有声读物、数字化档案材料以及无数其他资源。

随着图书馆目录中描述的格式数量不断增加,术语“书籍”的含义变得越来越模糊。正如芭芭拉·蒂莱特所说

The Group One Entities and their connections to Group Two entities, specifically people and corporate bodies. Group Two entities are described as creators of Works, realizers of Expressions, producers of Manifestations, and owners of Items.
第一组实体及其与第二组实体的联系
当我们在日常语言中说“书籍”这个词时,我们实际上可能指的是几件事。例如,当我们说“书籍”来描述一个有纸张和装订的实物,有时可以用它来支撑门或支撑桌子腿时,FRBR 将其称为“项目”。当我们说“书籍”时,我们也可能指的是“出版物”,就像我们去书店购买一本书时一样。我们可能知道它的 ISBN,但具体副本并不重要,只要它状况良好,没有缺页即可。FRBR 将其称为“表现形式”。当我们说“书籍”作为“谁翻译了那本书”时,我们可能指的是特定的文本和特定的语言。FRBR 将其称为“表达”。当我们说“书籍”作为“谁写了那本书”时,我们可能指的是更高层次的抽象,即所有语言版本的基础概念内容,书中讲述的故事,一个人头脑中关于这本书的想法。FRBR 将其称为“作品”。[6]

由于这些问题,编目界认为有必要为编目建立一个新的概念模型,该模型不以模糊的“书籍”为中心。书目记录的功能要求,或 FRBR,试图澄清这种含糊不清的术语,并提供一个独立于特定编目规则和材料格式的模型。

FRBR 从四个“第一组实体”开始:作品表达表现形式项目。传统的目录记录结合了对每个级别的描述,但通常以对表现形式级别的描述为中心。在定义了这些第一组实体之后,FRBR 继续定义这些实体之间的关系,以及它们与其他实体的关系,例如作者、出版商和其他人员和机构(第二组实体)以及主题(第三组实体)。

与早期的巴黎原则一样,FRBR 与特定的编目标准,例如 AACR2 或国际标准书目描述 (ISBD) 相分离。但是,FRBR 模型已被用于为新的编目标准提供信息,例如资源描述与获取 (RDA),以及自动化系统和用户界面的更改。

关于 Java 编程语言的书籍,按美国国会图书馆分类法排序。

要创建分类系统,您需要四件事

  • 类别,或根据相似特征对物体进行分组的方法
  • 类别的标签,或以人类语言表达这些概念类别的几种方法
  • 符号,另一种表达这些类别的形式。符号有助于自动化流程,并使人类更容易操作。例如,杜威十进分类法将“乌克兰的犹太人”主题的符号标记为 305.89240477。这比下面所示的未标记版本更容易上架和检索。
Class notation: 305.89240477
''vs.''
Class labels: Social sciences > Groups of people > Jews > Subdivided geographically > Europe > Russia and Eastern Europe > Ukraine
  • 类别之间的关系(这些关系通常是分类的,即等级式的)。例如,在上面的示例中,欧洲俄罗斯和东欧之间存在等级关系

杜威十进分类法

[编辑 | 编辑源代码]

DDC 已经发布了第 23 版,并且是“世界上使用最广泛的分类系统”。它可以以四卷本印刷版、完整的 WebDewey 或简略印刷版或网页版(更适合小型馆藏)的形式订购。会员资格包括其网页版的季度更新,以及半年刊的 DDC 通讯,参加会议和研讨会的机会,OCLC 文章和案例研究。该网站非常容易使用。它并不复杂,如果您的图书馆有需要,它会直奔主题。它没有很多“花里胡哨”,但具有必要的要素,而且易于理解。就章节而言,该网站提供的信息是学习 DDC 时可以使用的基本来源。杜威十进分类法是如此众多图书馆不可或缺的一部分,很难想象没有这样一个结构良好的组织工具可以使用。[7]

分类法与大众分类法

[编辑 | 编辑源代码]

信息架构

[编辑 | 编辑源代码]

信息架构是一个始于 20 世纪 90 年代的高科技繁荣时期的领域。它们类似于建筑师,但它们为网站进行设计。IA(信息架构师)构成网站的逻辑结构。他们研究用户的需求,并根据用户体验设计视觉和交互设计,使信息更易于查找,并在网站上更易于操作。这也有助于更轻松地管理网站。

IA 关注的关键概念是

  • 组织
  • 导航
  • 搜索
  • 标记
  • 控制

然后,IA 绘制蓝图,并与技术、图形和编辑团队成员密切合作以完成网站。IA Chris Farnum 在他们的专业领域非常博学,并提供了很多信息,他们继续解释说,可以通过书籍、研讨会和大学课程来了解他们的领域。我喜欢信息表达得非常清晰,并详细解释,我认为在当今的技术世界中,这种职业非常有必要。在当今网络世界中,拥有如此多的网站选择和选择,我认为有必要使您的网站尽可能具有市场竞争力和用户友好性。[8]

信息检索

[编辑 | 编辑源代码]

人工智能在信息检索中具有两种主要应用:应用方法的组织和分类方法的设计。这两个领域之间没有共享的术语,这使得这两个领域最初难以合作。琳达·C·史密斯在 1976 年的文章“人工智能与信息检索”中预测,随着人工智能和信息检索的不断发展,用户仍然需要提高认知能力,以区分从原始搜索中检索到的信息。对用户的另一个担忧是,他们预计为了使用该系统,用户需要成为专家才能获得所需的结果。在文章发表时,人们对这些检索系统回答问题和检索事实的能力越来越感兴趣,我们今天在每天使用的现代搜索引擎中看到这两项内容都已实现。人工智能被认为对信息检索具有短期和长期影响。在短期内,它将在查询期间修改当前搜索的结果,以满足用户的当前需求。从长远来看,它将修改文档表示以改善响应。这篇文章是对作者 1980 年初次研究的后续研究。在那个时期,对于使用人工智能技术作为图书馆科学和信息检索中实际应用的可行性,人们的态度和展望几乎没有变化。从我个人的角度来看,有趣的是,常见的搜索引擎使用作者认为只有专家才能完成的那种辅助搜索来查找相关主题。[9]

万维网 (WWW) 在学校图书馆中很常见,因为它作为一种教育工具的价值。之前的研究表明,领域专业知识可以提高在线搜索性能。其他研究表明,WWW 浏览体验在提高搜索效率或准确性方面并没有起到显著作用。作者的研究测试了四年级学生在线搜索性能与他们对 WWW 使用的熟练程度之间的关系;领域专业知识水平(荷兰文学)是一致的。结果表明,WWW 专家比新手更擅长定位网站,但 WWW 经验不会实质性地影响在特定网站上信息定位的效果。作者认为,定位网站更多地涉及使用搜索引擎,而专家在这方面更熟练,但在网站上查找信息通常涉及浏览,而 WWW 经验并不那么重要。尽管新手不是真正的初学者,专家也不是专业人士,但新手将从教授搜索技能的课程中受益匪浅,例如如何使用搜索引擎和布尔运算符。我认为,确定搜索结果相关性和有效性的指令与搜索技能一样重要,但本文没有涉及这一点。然而,判断相关性取决于用户对某个主题的了解,而学校图书馆员通常不负责教授这些主题。为了让学生接受最好的教育,教师、学校图书馆员和 WWW 之间必须建立良好的关系。[10]

信息科学的核心是“相关性”的概念,这是一个主观的概念。相关性被广泛地定义为衡量信息源与用户之间信息交换或接触的有效性的指标,所有这些都基于对有效沟通的的不同看法。这个概念是整个信息检索系统设计和利用的基础。关于这一点有许多不同的观点,但无论它们是如何定义或利用的,它们都是有一定联系和相互关联的。作者详细描述了这些不同观点的框架以及每个关于有效沟通的观念背后的基本哲学。他认为,所有这些不同的构造都是不完整的(但正确);取决于一个人从哪里开始考察交流过程。他以对该主题进行更多研究的呼吁作为结束语。他的论文是对三十年前相反论点的回顾,但实际上现在比以往任何时候都更加重要,因为新的信息系统不断涌现(互联网、电子数据库、馆藏经费等等),而所有这些系统都是基于对“有效沟通”的不完整定义。[11]

语义网、RDF 和链接数据

[edit | edit source]
An RDF graph describes Semantic Web innovator Eric Miller through a combination of literal strings and URIs. His title, a relationship described by the URI http://www.w3.org/2000/10/swap/pim/contact#personalTitle, is described by the literal string "Dr." His email address, a relationship described by the URI http://www.w3.org/2000/10/swap/pim/contact#mailbox, is described by the literal string "mailto:em@w3.org". His type, a relationship described by the URI http://www.w3.org/1999/02/22-rdf-syntax-ns#type, is described by the URI http://www.w3.org/2000/10/swap/pim/contact#Person, indicating that he is a person
一个 RDF 图通过组合文字字符串和 URI 来描述语义网创新者 Eric Miller。

Eric Miller 和 Ralph Swick 将语义网描述为“当前网络的扩展,其中信息含义从信息本身清楚而明确地链接,从而更好地使计算机和人能够协同工作”。

语义网是一组技术,旨在将当前网络(充满了非结构化和半结构化文档)转换为“数据网络”,其中所有文档都以机器可读格式和人类可读格式提供。语义网爱好者认为,这种机器可读格式的丰富性将使人类用户和自动化技术都能更容易地查找、共享和组合信息。

语义网通过使数据可用于数据提供者未计划或设想目的,从而促进和鼓励更多的数据重用。例如,假设您想找到上个月发布的关于总部位于人口不足 500,000 的城市的公司的新闻文章,或者将公司的股票价格与其总部所在地的天气进行比较,或者在线产品目录中搜索与某件物品等效的替换零件。这些信息可能存在于网络中,但目前仅以需要大量人工处理的形式存在。

[12]

当前使用 RDF 的一项关键资源是 DBpedia,这是一个从维基百科项目中提取 RDF 数据的努力。一个典型的 DBpedia 记录示例可以在 http://dbpedia.org/page/Audre_Lorde 中看到,这是一个对 Audre Lord 的人类语言描述,Audre Lord 是一位“黑人女同性恋女权主义者母亲诗人战士”,她还曾担任图书馆员。完全相同的信息以机器可读格式在 URI http://dbpedia.org/data/Audre_Lorde 中提供。对于人类格式为 http://dbpedia.org/page/Topic 的每个 URI,机器都存在一个格式为 http://dbpedia.org/data/Topic 的 URI,它表达了完全相同的数据。还可以注意到,所有属性以及许多属性的值都是可以点击的链接。大多数这些链接也以机器可读格式提供,这意味着机器可以重复跟踪这些链接来整合来自众多来源的关于 Audre Lorde 的信息。

Miller 和 Hillmann 为了理解语义(上下文)网络,描述了网络的构成:语义、结构和语法。语义是指信息的上下文及其含义。结构包含信息是如何组织的,语法是如何传递语义和结构的。可扩展标记语言 (XML) 处理语法,资源描述框架 (RDF) 使结构成为可能。图书馆最适合采用 XML 和 RDF 来解决编目和基于 Web 的接口,以共享信息。他们有责任利用传统模型 (MARC) 和当前发展 (XML 和 RDF) 来控制他们的信息并为读者提供可用的接口。这篇文章简洁明了,作者试图对这些混乱的首字母缩略词进行解码的做法值得称赞。然而,从外行的角度来看,这些仍然是难以理解的概念。Miller 和 Hillmann 担心图书馆的关注面太窄,无法满足读者的需求。现在语义网有了更大的可能性,图书馆应该包括通常被遗忘的项目,例如较旧的期刊或声音文件。这确实是后现代的。尽管这令人激动(看到通常被排除在图书馆范围之外的项目被纳入),但我想知道这在公共图书馆中的可行性。公共图书馆员准备学习这些新语言吗?读者已经准备好将他们的公共图书馆视为不仅仅是书籍和互联网访问的资源,但图书馆是否准备提供这些服务?[13]

知识管理

[edit | edit source]

知识管理是数据和信息管理的产物。竞争加剧以及拥有分析技能且对组织忠诚度降低的流动性 workforce 使知识管理和保留的概念对管理者具有吸引力。

知识管理 (KM) 曾经是企业界的专属领域,现在对于许多信息学科来说是必不可少的。信息专业人员需要了解什么使 KM 有效。这种理解始于知识是一个不断变化的实体,由人类经验、情感和感官组成。学者们已经确定知识包括隐性(内部)知识和显性(内部知识的体现)。组织已经开发了 KM 系统来促进隐性和显性知识的共享,以及两者之间的共享,通过讨论、培训、团队建设等方式。作者认为(尽管批评人士认为 KM 不可能完成如此主观和人性化的过程),但企业界有很多例子证明 KM 已经将盈利能力、创新等最大化。基于这些例子,作者强调了指导有效 KM 的原则。这些原则包括致力于重视个人经验和开放式沟通的环境,将其作为共享和学习的手段;利用技术来适应知识(强调时效性、可访问性等);以及理解 KM 需要扎根于隐性和显性知识形式。知识的流动性得到了很好的发展。然而,这种不断发展的知识如何影响 KM 是通过完全来自企业组织领域的例子来说明的。如果 KM 的范围正在超出传统组织,那么在新的信息化环境中甚至缺乏轶事证据。为信息专业人员提供的含义是对为企业服务模型的重新阐述。目前尚不清楚 KM 如何在拥有知识的动态性和人性化的意识下,在信息化环境中表现出不同的面貌。如果本文能够区分有效 KM 在不断扩展的信息行业与传统企业模型下的外观、感受和运作方式,将更有帮助。[14]

David Blair 认为,早期管理知识的尝试失败了,因为它们试图改进或取代人类决策。知识管理并不取代人类决策,而是促进人类决策。专家是系统的一部分。作者有说服力地论证了数据和信息管理对组织的回报有限,并且没有人类专家的 AI 项目和系统并没有取得成功。作者认为,知识管理需要“实践社区”,一种专家与新手分享知识的文化。此外,必须通过技术提供各种各样的信息媒体来支持知识管理。知识工作者需要强大的批判性思维能力以及从各种来源查找和评估信息的能力。

实施知识管理的最大挑战是创造一种促进知识共享的组织文化,处理隐性知识以及有关知识产权性质的法律问题。作者认为,尽管隐性知识可能无法表达,但经验法则和“最佳实践”、问题案例研究以及解决方法可以为专家提供做出明智决策的知识。

知识管理的某些方面已经得到实施。知识管理是组织用来保持竞争力的众多新兴信息技术之一。[15]

信息组织中的普遍问题

[编辑 | 编辑源代码]

信息组织的政治

[编辑 | 编辑源代码]

桑福德·伯曼的《偏见与反感》

霍普·奥尔森的《命名的权力》

1.^ 原则在脚注中不情愿地说,“书籍一词应包括具有类似特征的其他图书馆资料”,并“一次提到连续出版物和期刊”。

参考文献

[编辑 | 编辑源代码]
  1. Hargittai, E. (2000). 开放门户还是封闭大门?在万维网上引导内容。诗学,27(4), 233-253.
  2. Bates, Marcia. “严谨的系统性书目”。RQ 16 (1976 年秋季): 2-26.
  3. Radebaugh, Jackie. “MARC走向全球——并且简化了”。美国图书馆 34 (2003 年 2 月): 43-44.
  4. “数字时代文献框架” 美国国会图书馆文献框架过渡倡议。 http://www.loc.gov/marc/transition/news/framework-103111.html (访问日期:2013 年 3 月 12 日).
  5. 国际编目原则会议 (巴黎:1961 年)。报告。– 伦敦:国际图书馆协会联合会,1963 年,第 91-96 页。
  6. Tillett, B. (2004). 什么是 FRBR:文献宇宙的概念模型。华盛顿特区:美国国会图书馆编目发行服务。检索自 http://www.loc.gov/cds/downloads/FRBR.PDF
  7. “杜威服务”。[在线] 可从 www.oclc.org//dewey 获取。 (访问日期:2004 年 1 月 15 日.)
  8. Farnum, Chris. “信息架构:信息管理人员需要知道的五件事”。信息管理杂志 (2002 年 9 月/10 月): 33-40.
  9. Smith, Linda C. "人工智能和信息检索"。信息科学与技术年鉴 (ARIST) 22 (1987): 41-77.
  10. Lazonder, Ard W., Harm J.A. Biemans 和 Iwan G.J.H. Wopereis. "新手和经验丰富的用户在万维网上搜索信息时的差异”。美国信息科学学会杂志 51 (2000): 576-581.
  11. Saracevic,T. “相关性:信息科学中对该概念的思考的回顾与框架”。美国信息科学学会杂志 26 (1975): 321-343.
  12. Miller, E. 和 Swick, R. (2003). W3C 语义网活动概述。美国信息科学与技术学会通讯, 29(4), 检索自 http://www.asis.org/Bulletin/Apr-03/millerswick.html
  13. Miller, Eric 和 Diane Hillmann. “图书馆和语义网的未来:RDF、XML 和字母汤”。在“编目网络:元数据、AACR 和 MARC21:ALCTS 图书馆技术服务与馆藏论文”。由 Wayne Jones、Judith R. Ahronheim 和 Josephine Crawford 编辑。兰汉,马里兰州:稻草人,2002 年,第 57-64 页。
  14. McInerney, Claire. "知识管理与知识的动态本质”。美国信息科学与技术学会杂志 53 (2002): 1009:1018.
  15. Blair, David C. “知识管理:炒作、希望还是帮助?”。美国信息科学与技术学会杂志 53 (2002): 1019-1028.
华夏公益教科书