跳转到内容

ETD 指南/技术问题/元数据

来自维基教科书,开放世界中的开放书籍

除了创建 ETD,学生现在还需要成为自己的编目员。NDLTD 开发的工具将有助于提交 ETD 的基本描述,但需要开发技能并注意一些问题。

学生已经发现,寻找信息的最大障碍之一是很难找到合适的术语。为了解决这个问题,人们创建了标准化的主题词表、结构化词典和字段搜索。

准确的元数据通过使用相同的标准化术语或元素,提高了 ETD 内容的精确度并增加了召回率。但是,即使使用了常见的元数据元素,也不能保证词汇,即元素的内容,在不同的利益群体之间是兼容的。在专业领域工作的学生和研究人员有时会忘记语言和术语通常具有特定而精确的含义。在这一领域之外,全局搜索可能会返回太多错误的信息。

生成准确的元数据需要一些资源描述的基本技能,以及避免导致精确度较低的三个语言问题的良好做法。

  • 多义性:一个词有多个意思。例如,如果我们正在搜索一篇讨论弹簧类型及其用途的文章,我们可能会检索到关于淡水泉或春季的文章,以及关于板簧、扁簧或螺旋弹簧的文章。
  • 同义词:代表同一概念的词,尽管它们可能以不同的含义表达。例如,“球”、“球体”和“球形”,或者“水肺潜水”与“皮肤潜水”。如果我们寻找水肺潜水,但使用的术语是皮肤潜水,我们会错过可能找到的其他资料。良好的元数据应该将这些资料汇集在一起,尽管它们使用了不同的同义词。
  • 歧义:如果我们回到弹簧的例子,我们可以看到是什么区分了这些意思,那就是它们的上下文。一篇关于螺旋弹簧的文章不太可能讨论水质。文章中使用的其他词语以及描述的过程将完全不同。如果搜索引擎想要区分同一个词的不同含义,它必须理解含义,而不仅仅是匹配单词的拼写。解决这一困难的一个可能的解决方案在于最近发展起来的应用配置文件的概念。应用配置文件为元数据以“包”的形式聚合的方式提供了一个模型,以便将与一个资源相关的不同元素集组合在一起。这是一种理解实现者和命名空间管理器对元数据模式的不同关系,以及他们使用和开发模式的不同方式的方法。学生应该调查他们在其利益群体中的这些发展。

资源

参见:元数据:用其他名称编目… 作者:Jessica Milstead 和 Susan Feldman 在线,1999 年 1 月

在线获取 [在线] http://www.onlineinc.com/onlinemag/OL1999/milstead1.html

参见:应用配置文件:混合和匹配元数据模式 Rachel Heery 和 Manjula Patel

在线获取 [在线] http://www.ariadne.ac.uk/issue25/app-profiles/


下一节:全文

华夏公益教科书