ETD 指南/未来/互操作性
在我们的各个地点,电子学位论文和学位论文的文档服务器都是独立于彼此设置的。目标是建立一个站点网络,允许在异构知识库中进行全球检索,独立于所提供数据的物理位置。用户无需单独导航和搜索各个服务器。他们应该获得一个可以链接到 ETD 站点网络所有不同节点的检索界面。这是检索可以进行的水平级别。
另一个级别,我们称之为信息门户的垂直级别,将是配置检索界面以允许用户仅检索相关和所需信息,而不是接收所有可能提供的信息的级别。我们希望避免信息过载的“Altavista 效应”。用户应该能够在特定主题内和特定信息结构中搜索。例如,他们应该能够仅在作者字段或标题字段内、特定关键字或机构内或仅在摘要字段内进行搜索。一个高度复杂的检索设施将允许在某些内部文档结构(例如参考文献)中进行全球搜索。
对于人文社会科学以及自然科学和技术科学中学位论文的科学用途,不仅需要提供书目元数据和全文,还需要提供用于检索的结构信息,例如
- 目录;
- 表格和图形的标题;
- 特殊索引词,例如姓名或人物索引或位置索引等);
- 指向外部来源的引用(链接)(印刷资源以及网络资源);
- 参考文献;
- 作品中的引用或脚注;
- 定义;
- 数学/化学公式;
- 论文/假设
这些结构化元数据是文档的组成部分,必须由作者定义。目前,这主要是在格式化文本(例如标题、脚注等)时进行。为了将这些结构化数据用于检索,作者必须使用结构化语言(如 LaTeX)或“样式表”(如 WinWord)对其进行标记。
互操作性的最低公分母是什么?
上述发展的第一步是就学位论文和学位论文的通用元数据集达成一致,并制定有关如何在 ETD 项目中使用该元数据的指南。有关 NDLTD 提出的都柏林核心元数据集,请参阅http://www.ndltd.org/standards/metadata/。这些指南可以得到其他免费软件工具的支持,这些工具将允许图书馆工作人员创建必要的元数据集,而无需具备实际 HTML 或 XML/RDF 编码的技术知识。这种“元数据创建器”已针对德国 ETD 项目开发,可以翻译成英语、法语、西班牙语和葡萄牙语。MySQL 或其他免费软件可用作底层数据库系统。
开放档案规范:元数据互操作性的机会
在过去两年中,一项倡议极大地影响了数字图书馆和数字图书馆社区关于互操作性的讨论。
的发展
- 一个协议,可以在档案服务器上轻松实现,并且
- 一个基于都柏林核心元数据集的元数据集
允许档案,如 ETD 服务器、预印本档案以及博物馆和其他机构,向全球社区提供其本地目录,而无需实现专门的复杂界面。
因此,开放档案框架(见http://www.openarchives.org)允许异构和分布式 ETD 档案和服务器在非常低的互操作性级别进行互操作。
对于 ETD 倡议和项目,OAI 合规性必须被视为连接全球 ETD 服务器的机会。
下一节:未来的愿景