语义网/屏幕抓取和表单
外观
< 语义网
为了让语义网发挥其全部潜力,许多人需要开始以 RDF 格式发布数据。这些信息将从何而来?其中很大一部分可以从现有的许多数据出版物中获取,使用一种称为“屏幕抓取”的过程。屏幕抓取是指通过各种手段,将数据从源头获取到更易于管理的格式(例如 RDF)的过程。两个用于屏幕抓取的有用工具是 XSLT(一种 XML 变换语言)和正则表达式(在 Perl、Python 等中)。
但是,屏幕抓取往往是一个繁琐的解决方案,因此另一种方法是构建适当的 RDF 系统,这些系统接收用户输入,然后直接将数据存储在 RDF 中。例如,您在注册新邮件帐户、在线购买 CD 或搜索二手车时输入的数据,都可以存储为 RDF,然后在语义网上使用。