开放元数据手册
开放元数据手册是公共领域工作组和开放书目数据工作组的合作项目,隶属于开放知识基金会.
本书旨在为非专家提供有关作品元数据发布标准和最佳实践的概述。其主要关注点是文化遗产机构的元数据,即 GLAM 机构(美术馆、图书馆、档案馆和博物馆)。
本书的编写是为了帮助我们理解各种元数据集合,我们希望使用这些集合来确定哪些作品在哪些国家进入公共领域。在 OKF,我们一直在努力开发自动化计算来确定作品的公共领域状态(参见http://publicdomain.okfn.org/calculators),我们很快意识到,我们通常没有必要的元数据来准确地确定作品是否处于公共领域。我们从不同的来源获得了数据,例如 BBC、英国国家图书馆,但我们需要以有意义的方式将这些数据结合起来,以便获得更全面的元数据集。这要求我们参与词汇对齐过程,消除重复条目,了解类似字段是否实际上意味着相同的内容,以及确定不同的数据模型是否彼此兼容。
这引发了一系列新的问题
- 有哪些不同的元数据标准?
- 它们如何与不同类型的作品相关?
- 它们各自的优缺点是什么?
- 这些标准是否可以互操作?
- 它们是跨境的吗?跨行业的吗?
- 我们如何整合来自不同来源的数据?
本书旨在以浅显但详尽的方式回答其中一些问题。
开放元数据手册并非
- 专为具有专业技术知识的人员设计的通用元数据指南。
- 又一个关于如何建立开放和互操作元数据模型的最佳实践或建议系列。
开放元数据手册是
- 一个关于现有工具和标准的简单指南,尝试绘制不同机构、组织和项目使用的元数据结构,包括但不限于 GLAM 机构。
- 一系列指南,帮助人们浏览该领域已经完成的大量工作,帮助他们通过元数据实现适当的文档发现和分析。
开放元数据手册的最终目标是
- 帮助任何人都能了解元数据,即使他们没有数据管理方面的教育。
- 鼓励以互操作的方式开发和集成元数据。
- 简化从各种来源收集和处理书目元数据。
- 促进社区参与本文件的起草工作。
开放元数据手册不仅关注文学作品(书籍、文章等),还关注艺术作品、音乐作品、视听作品等等。虽然重点一般是书目作品,但也有大量关于电影/视频、声音和制图数据的元数据,以及关于数据集(人口普查等)的元数据。我们不打算提供对每个标准的详细概述,而是通过一系列指向更准确信息的指针,说明不同领域的最新技术水平。重要的是要探索如何使用元数据来描述不同类型的作品,以便确定元数据的使用是否(以及在多大程度上)因所考虑的作品类型而异。这也将使我们能够确定哪种标准最适合每种类型的书目作品,以及原因。
开放元数据手册分为 5 个部分
- 介绍,提供对最基本概念的定义
- 什么是元数据?
- 元数据有什么用?
- 它是如何产生的?
- 它是如何使用的?
- 什么是开放元数据
- '开放' 意味着什么?(opendefinition.org)
- 为什么要开放元数据?(参见开放书目原则 @ http://openbiblio.net/principles - 但强度不如此)
- 法律问题
- 法律的默认立场
- 开放许可证
- 技术问题
- 可访问性
- 互操作性
- 可重用性
- 案例研究:http://obd.jisc.ac.uk/examples
- 技术概述 不同元数据标准
- 来自不同领域的元数据记录的解剖(3-5 个例子)
- 为什么会有不同的元素和不同的标准?
- 对电影、艺术品、文学作品等最常用元素的概述
- 对当前可用标准的概述
- 它们的目标、历史背景、相应的优缺点 + “个人笔记”
- 对不同序列化模式的概述
- 不同应用领域(谁使用什么)的例子 - 例如带有屏幕截图
- 数据集成
- 如何整合来自不同标准的数据,不同标准如何相互交互?例如协议、互操作性。
- 如何理解来自不同标准、不同领域、不同需求的元素?例如词汇对齐。
- 有哪些工具可用于元数据的发现、识别、定位和去重?
- 例如收藏信托的例子。
- 附录
- 资源、邮件列表、书籍列表
- 词汇表
开放元数据手册适用于
- GLAM 机构:鼓励他们开放元数据,并帮助他们了解在不同元数据标准之间提供互操作性时必须解决的挑战。许多机构不了解其他机构的元数据系统。
本指南将指引他们了解所有当前存在的资料。因此,目标不是协调元数据的使用,而是提供有关不同标准如何相互交互的指导。
- 有兴趣从文化遗产组织重用开放元数据,但可能不太了解其结构的人。因此,手册必须易于非技术用户访问,并对有兴趣消费开放数据的非专家有用,他们可能来自各种不同的来源。
- 任何有兴趣广泛了解与作品元数据发布相关的标准和最佳实践的人。作为教科书,开放元数据手册应包含案例研究和以百科全书研究为基础的内容。
- Primavera de Filippi
- Andrea Marchesini
- Jim Pitman
- Karen Coyle
- Claudio Gnoli
- John Mark Ockerbloom
- Owen Stephens
- Pascal Christoph
- Antoine Isaac
- Rakesh Kumar Pandey
鉴于开放元数据手册已采取的新方向,以下大多数资料现在已过时。但是,它可能包含应纳入新指南的有用资料
- 元数据元素:核心元数据元素,用于发现、识别和描述不同类型的作品
- 另见 http://openbiblio.okfnpad.org/metadata-elements
- 元数据标准: 介绍目前可用标准的最新情况,包括它们不同的应用领域(谁使用什么)以及最受欢迎的标准在书目作品方面的优缺点。
- 另见 http://openbiblio.okfnpad.org/metadata-art 和 http://openbiblio.okfnpad.org/metadata-procons
- 建议: 关于我们认为最适合开放书目目的的标准的结论/建议。这应该以决策树的形式呈现,不同的数据提供商可以回答简单的问题,以了解他们在交换格式和元数据格式方面的最佳实践。
- 另见 http://openbiblio.okfnpad.org/metadata-conclusions
- http://wwwsearch.sourceforge.net/bib/openbib.html
- http://www.lib.umn.edu/datamanagement/metadata
- http://standards-catalogue.ukoln.ac.uk/index/JISC_Standards_Catalogue
- http://www.niso.org/publications/press/UnderstandingMetadata.pdf
- http://libraries.mit.edu/guides/subjects/metadata/standards.html
- http://www.bl.uk/bibliographic/service.html
- http://www.w3.org/2005/Incubator/lld/XGR-lld/
- http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/
- http://www.w3.org/2005/Incubator/lld/XGR-lld-usecase/