开放教育手册/创建开放数据
外观
< 开放教育手册
您如何开放数据在开放数据手册中详细介绍。有三个关键规则建议在开放数据时使用
- 保持简单。从小,简单,快速开始。没有要求每个数据集都必须立即公开。从打开一个数据集,甚至一个大型数据集的一部分开始就可以了 - 当然,你能打开的数据集越多越好。
- 记住这是关于创新的。尽可能快地前进是好的,因为它意味着你可以建立势头并从经验中学习 - 创新与失败一样多地与成功有关,并非所有数据集都将有用。
- 尽早参与并经常参与。尽早并尽可能频繁地与数据的实际和潜在用户和重新使用者互动,无论是公民、企业还是开发者。这将确保您的服务的下一迭代尽可能地相关。
- 必须牢记的是,许多数据不会直接到达最终用户,而是通过“信息中介”。这些人获取数据并对其进行转换或重新混合,以进行呈现。例如,我们大多数人都不想要或不需要一个大型的 GPS 坐标数据库,我们更喜欢一张地图。因此,首先与信息中介互动。他们会重复使用和重新利用这些材料。
- 解决常见恐惧和误解。如果您在政府等大型机构中工作或工作,这一点尤为重要。在开放数据时,您会遇到很多问题和恐惧。重要的是 (a) 确定最重要的是哪些,以及 (b) 在尽可能早的阶段解决它们。
- 选择您计划公开的数据集。请记住,如果您在稍后阶段遇到问题,您可以(可能需要)返回此步骤。
- 应用开放许可。
- 确定数据中存在的知识产权。
- 应用合适的“开放”许可,该许可对所有这些权利进行许可
- 提供数据 - 批量和有用格式。您可能还想考虑通过 API 等其他方式提供数据。
- 使其可发现 - 发布在网上,并可能组织一个中央目录来列出您的开放数据集。
在开放数据时,重要的是要考虑发布的潜在伦理影响。一个有用的资源来思考这一点是OER 研究中心道德手册。
虽然人类用户无疑是开放数据的最终消费者,就像在教育中一样,在任何其他领域,人类互动不一定是消耗和处理这些数据的唯一方式,直到它们以满足其需求的形式交付给最终用户。更常见的是,软件系统将以应用程序和服务的形式扮演消耗数据并将它们或其副产品交付给用户的角色。
然而,许多现有的内容以供人脑处理的形式呈现甚至存在,例如自然语言文本、图像和视听素材。虽然有一些技术可以让软件系统从这些内容中提取有意义的数据,但更干净、更不易出错的方式是数据提供者以机器可读形式发布其内容。在大多数情况下,这些数据不会*替换*它们的自然语言或视听形式:相反,它们可以用来*增强*以人类可读形式呈现的内容,以多种方式。
常见的开放数据技术
关于通过 URI 可访问的链接数据可用性的一个基本原则需要理解的是,它们并不阻止同一资源以其他格式在同一 URI 上呈现。这意味着将同一个 URI 粘贴到 Web 浏览器中不一定会提供一个描述该资源的 RDF 文档,就像它不意味着只有一个 RDF 格式可以在该地址提供一样。得益于现代 Web 服务标准,例如 REST 架构风格,对于任何 URI,应用程序都可以即时协商应用程序本身和数据提供者都支持的格式。