跳转到内容

语义网/简介

来自维基教科书,开放世界中的开放书籍

语义网 是万维网 (WWW) 的一项激动人心的演变,它提供了机器可读机器可理解 的信息,远远超出了当前的能力。在信息泛滥的时代,政府、个人和企业将越来越依赖自动化服务,这些服务将通过“理解”网络上的更多内容来提高协助人类的能力。这对当今所有企业都有可能产生深远的影响。

网络上的更多信息需要以机器可以“理解”和处理而不是仅仅显示的形式进行结构化。它完全依赖于机器通过对定义明确的数据执行定义明确的操作来解决复杂问题的能力。万维网的发明者蒂姆·伯纳斯-李创造了“语义网”一词来描述这种方法。伯纳斯-李、亨德勒和拉西拉给出了以下定义

语义网不是一个独立的网络,而是当前网络的扩展,其中信息被赋予了明确的含义,从而使计算机和人类能够更好地协同工作。

—蒂姆·伯纳斯-李,奥拉·拉西拉,詹姆斯·亨德勒,科学美国人 2001 年 5 月

什么是语义网?

[编辑 | 编辑源代码]

语义网是一个在全球范围内以机器易于处理的方式链接起来的信息网格。您可以将其视为一种在万维网上高效表示数据的形式,或者将其视为一个全局链接的数据库。

语义网是由 WWW、URI、HTTP 和 HTML 的发明者蒂姆·伯纳斯-李构思的。万维网联盟 (W3C) 有一支专门的团队致力于改进、扩展和标准化该系统,并且已经开发了许多语言、出版物、工具等。然而,语义网技术仍然处于起步阶段,尽管该项目总体前景看好,但关于早期语义网的可能方向和特征似乎没有达成共识。

为什么需要这样一个系统?通常隐藏在 HTML 文件中的数据在某些情况下很有用,但在其他情况下却无用。目前,网络上大多数以这种形式存在的数据的问题是,很难在大型范围内使用,因为没有一个全球性的系统可以以一种易于任何人处理的方式发布数据。例如,只需考虑一下关于当地体育赛事的信息、天气信息、航班时间、美国职业棒球大联盟统计数据和电视指南……所有这些信息都由众多网站提供,但所有这些信息都以 HTML 格式呈现。问题是,在某些情况下,很难以人们可能想要的方式使用这些数据。

因此,语义网可以被视为一项巨大的工程解决方案……但它不仅仅是工程解决方案。我们会发现,随着以可重复使用形式发布数据变得更加容易,更多人会想要发布数据,并且会产生连锁反应或多米诺骨牌效应。我们可能会发现,大量语义网应用程序可以用于各种不同的任务,从而提高网络上应用程序的模块化程度。但足够的主观推理……进入如何实现这一点。

语义网通常建立在使用 URI 来表示数据的语法之上,通常以三元组结构的形式,即许多可以保存在数据库中或使用专门为该任务开发的一组特定语法在万维网上交换的三元组 URI 数据。这些语法称为“资源描述框架”语法。URI - 统一资源标识符

URI 只是一个网络标识符:就像您在万维网上经常看到的以“http:”或“ftp:”开头的字符串一样。任何人都可以创建 URI,并且它们的拥有权明确委托,因此它们构成了构建全球网络的基础技术。事实上,万维网就是这样:任何具有 URI 的东西都被认为是“在网络上”。

URI 的语法由 IETF 严格管理,IETF 发布了 RFC 2396 作为通用 URI 规范。W3C 维护一个 URI 方案列表。

华夏公益教科书