信息技术导论/关系型数据库
关系型数据库是一种结构能够识别数据之间关系的数据库。这意味着数据库中的数据可以以多种方式进行分析,而无需更改数据库表。这些数据库的基本结构是一组表,将数据组织成预定义的类别。这些数据库很容易添加新数据,无论是更多信息还是新的数据类别。与该系统交互的标准方式是通过结构化查询语言 (SQL)。这种语言用于收集数据和执行查询以获取数据库中的信息。
数据库是数据集合,以可管理和更新的方式进行组织。它是模式、表、查询、报表、视图和其他对象的集合。
关系型数据库最初是由 IBM 圣何塞研究实验室的 Edgar Codd 于 1970 年 6 月定义的。Codd 对什么构成 RDBMS 的看法总结在 Codd 的 12 条规则中。关系型数据库已成为最主要的数据库类型。除了关系模型之外,还有其他模型,包括层次数据库模型和网络模型。
下表总结了一些最重要的关系型数据库术语和相应的 SQL 术语
SQL 术语 | 关系型数据库术语 | 描述 |
---|---|---|
行 | 记录 | 表示单个项目的数据集 |
列 | 属性 或 字段 | 元组的带标签元素,例如“地址”或“出生日期” |
表 | 关系 或 基关系 | 一组具有相同属性的元组;一组列和行 |
视图 或 结果集 | 派生关系 | 查询 |
DBMS 代表数据库管理系统。这种类型的软件用于与数据库交互并访问其中存储的内容。DBMS 提供了一种查看多个用户从多个位置访问的数据的方式,同时限制了哪些数据可见。使用 DBMS 的一些优势包括保护您的数据,如果数据在一个地方组织起来,则更容易查找,并且更难丢失,并且 DBMS 中的活动会被记录,以便您可以查看谁访问了哪些内容以及何时访问。
通过插入新数据、删除数据或修改现有数据来修改数据库中的数据。
从数据库中检索数据并提供给用户。
执行任何服务以使数据库保持运行、安全并恢复丢失或损坏的数据。提供的服务可以是注册和维护新用户以及执行数据安全。处理这些任务的人员是数据库管理员。到目前为止,至少有 3 种类型的数据库管理员。
1. 系统 DBA(数据库管理员) - 这些管理员专注于管理数据库的物理方面,例如 DBMS 安装、修补和升级数据库以及一般维护。
2. 应用程序 DBA - 这些管理员负责管理访问数据库的应用程序组件,并配置数据库管理系统以供用户使用。他们处理此应用程序软件的应用程序修补程序和升级。
3. 开发 DBA - 他们专注于数据库管理的开发方面。这可能包括数据模型维护和设计、SQL 编写以及 DDL 或数据定义语言的生成。
键是将数据片段链接到另一个表的工具。主键是将数据链接到其他表的工具。主键不应重复,并且在引用值时不能为“NULL”、空白、空或零。外键将整行数据链接到该表或其他表的主键。这提供了两个表中数据之间的链接。
键是关系型数据库的重要组成部分。它们用于建立和识别表之间的关系。它们还确保表中的每条记录都可以通过表中一个或多个字段的组合来标识。我们还有超级键和候选键。超级键是表中的一组属性,用于标识表中的每条记录。它是候选键的超集。候选键是一组字段,从中可以选择主键。它是可以充当表的主键的属性或属性集,用于识别该表中的每条记录。未选择为主键的键称为辅助键或备用键。
一个表中的值对应于相关表中的唯一值。例如,一个社会安全号码列表,对应于该号码所属人员列表。
一个表中的值可能对应于相关表中的许多不同值。例如,父母列表和孩子列表。
一个表中的许多值可能对应于另一个表中的许多值。例如,兄弟姐妹列表和他们的兄弟姐妹列表。
实体关系图 (ERD) 是一个信息系统图示,以图形的方式展示系统中人员、对象、地点、概念或事件之间的关系。通常,如果想要分析、定义和描述某个业务领域中对流程重要的内容,就会使用 ER 模型。它是一系列实体和关系。实体能够独立于任何其他事物而存在,并且可以被识别。关系展示了每个实体如何与另一个实体相关联。
连接表(也称为桥接表)是为处理两个组之间多对多关系而设计的表。它们在数据集之间创建“连接”,允许它们彼此关联。例如,如果一个数据集有一组人员姓名和一组人员课程,则连接表将允许这两组之间建立关联。这是一种多对多关系,因为多个学生可以参加同一门课程,而一门课程可以有多个学生。
约束可以进一步限制属性的域。例如,约束可以将给定整型属性的值限制在 1 到 10 之间。约束提供了一种在数据库中实现业务规则的方法。SQL 以检查约束的形式实现了约束功能。约束限制了可以存储在关系中的数据。这些通常使用表达式定义,这些表达式会产生一个布尔值,指示数据是否满足约束。约束可以应用于单个属性、元组(限制属性组合)或整个关系。由于每个属性都有一个关联的域,因此存在约束(域约束)。关系模型的两个主要规则是实体完整性和参照完整性。
数据库规范化是一个将数据组织成列和行的系统过程。其目的是减少数据冗余(以避免异常)并确保数据的存储。减少或消除数据冗余非常重要,因为它会让应用程序开发人员难以将对象存储在关系型数据库中。数据规范化的直接益处是数据库系统的性能更快、更准确、更高效。因此,您可以从数据库获得快速响应。
基数指的是列中数据值的唯一性。低基数指的是一个包含多个重复值的列,而高基数指的是一个包含多个唯一值的列。它也指的是表之间的关系。这些关系是一对一、一对多和多对多。基数很重要,因为它以精确的方式将表连接在一起。
索引是一种数据结构,它有助于减少数据库表检索操作的时间。索引使用户能够定位他们想要查找的任何数据,而无需手动搜索数据库表中的每一行。数据库索引设置为使用查询,这些查询使用可以找到匹配序列的属性进行过滤。虽然索引通常不被视为数据库的一部分,但它们在使用数据库方面至关重要。