HSC 信息处理与技术/信息系统与数据库
- 将数据组织成信息(需要小心,否则数据将变得毫无意义,使用数据字典)
- 分析信息以获得知识(访问信息系统的目的,通过表格、查询和报表进行分析,基于此信息做出决策)
数据必须在被信息系统分析之前进行组织。但是,这必须小心谨慎,否则生成的信息将毫无意义。这可能需要排序、汇总或分类。数据使用数据字典等结构进行组织。
访问信息以及由此产生的知识是信息系统的目的。为了让人们获得知识,信息必须进行分析。信息系统提供了一系列用于数据分析的工具,如表格、查询和报表。人们根据从信息系统接收的信息做出决策。
- 事务处理系统 (TPS)- 收集、存储、修改和检索组织的日常事务,例如销售点终端。有两种类型的交易处理
- 批处理将交易数据收集到一个组中,并在以后进行处理,目前用于数据以纸质形式存在的情况,如支票。这种类型存在时间延迟。
- 实时处理在每个事务立即处理并提供即时确认的情况下工作,但它确实需要访问联机数据库。
- 决策支持系统 (DSS)- 通过提供信息、模型和分析工具来帮助人们做出决策。它们可以每天使用,也可以在组织需要对意外事件做出反应或进行更改时使用。专家系统是一种 DSS。
- 专家系统- 提供信息并解决否则需要该领域经验丰富的人(专家)才能解决的问题。它们在诊断、监控、选择、设计、预测和培训方面很有用。专家系统会向用户提出一些问题,并将答案与知识库进行比较,知识库是专家提供的通用事实和“如果-那么”规则的集合。然后它必须推理以获得解决方案。这些并不总是正确的,选择权在于用户。
- 管理信息系统 (MIS)- 为组织的管理人员提供信息。MIS 提供有关组织绩效的基本事实,例如预算或报告。对如何衡量绩效的认识为员工提供了动力,并有助于做出决策。一种特殊类型称为执行信息系统 (EIS),它专为满足高级管理人员的信息需求而设计,并提供战略性信息。
- 办公自动化系统- 为人们提供有效的方式在组织中完成管理任务。它们使用文字处理器、数据库等软件工具,以及通信技术。
- 地理信息系统 (GIS),地理信息科学或地理空间信息研究是一种旨在捕获、存储、操作、分析、管理和呈现所有类型地理参考数据的系统。[1] 简单来说,GIS 是制图学、统计分析和数据库技术的融合。
- 数据库信息系统 (DIS)- 大多数信息系统 (IS) 将数据存储在数据库中。数据库由数据库管理系统 (DBMS) 访问。DBMS 是一种软件包,允许用户管理数据。一些示例包括;MS Access、FileMaker Pro、MySQL。
使用数据库的信息系统被称为数据库信息系统。数据库由数据库管理系统 (DBMS) 访问,DBMS 本身不包含任何数据,而是一个软件包,允许用户输入、维护和提供对数据库的访问权限。用户可以选择需要哪些数据以及如何以有意义的方式显示数据。术语“数据库”通常用来代替 DBMS。
组织是整理、表示和格式化数据的过程。数据库是有组织地收集数据。
数据库只是一个整理和存储数据的地方,以便以后可以为特定目的检索数据。电话簿是一个非计算机数据库,它按人员的姓氏字母顺序组织数据。搜索人员姓名可以检索到他们的电话号码。纸质文件系统是一个非计算机数据库。它涉及纸张、文件夹和文件柜,以有组织的方式存储数据。在文件柜中搜索文件夹可以检索到单张纸。非计算机数据库通常是组织数据的最佳方式。从书籍中获取信息或从文件柜中访问信息很方便。人们可以轻松且廉价地使用非计算机数据库来组织数据。他们不需要计算机或计算机技能。非计算机数据库更容易保持安全,并且更私密。数据更难用于其他目的。例如,电话簿不允许小偷搜索地址并找到房屋的电话号码。计算机化数据库正越来越多地用于组织和存储数据。一些例子包括税务记录、图书馆系统、汽车登记、学生记录、CD-ROM 百科全书和人口普查数据。与非计算机化数据库相比,计算机化数据库有几个优势
- 易于编辑
- 存储量大
- 快速检索。
- 显示选项。
计算机化组织方法包括平面文件系统、数据库管理系统和超媒体。
• 与非计算机化方法相比,计算机化数据库(如汽车登记和 CD-ROM 百科全书)有几个优势
- 易于编辑。数据可以被修正和更新,而无需重新输入。
- 存储量大。数据存储在磁盘上,并在需要时检索。
- 快速检索。数据被快速准确地搜索和排序,以获取所需信息。
- 显示选项。数据以表格、表单和报表等多种方式呈现。
平面文件数据库将数据组织成一个单一表格,适合许多小型应用程序,使用名为文件、记录、字段和字符的数据结构。
- 文件是数据块。当您在计算机上完成了一些工作后,它就被存储在一个文件中。地址数据库是一个文件。数据库中的文件被分成一组相关的记录。
- 记录是关于数据库中一个特定条目的事实集合。在地址数据库中,记录是关于一个人的姓名、地址和家庭电话的信息。记录被分成一个或多个相关的字段。
- 字段是数据库中数据的特定类别。在地址数据库中,姓氏、名字、街道、郊区、邮政编码和家庭电话是字段。字段中的数据项由字符组成。
- 字符是人们可以使用的数据的最小单位。字符包括字母、数字和特殊符号。
键是用于排序和检索信息的字段。通常,每个键都包含一个仅适用于一个记录的唯一项目。当记录被排序时,键被使用,因此不必读取或检索所有数据。键有不同类型。单键是一个字段,其中每个数据项都是唯一的。在选择单键时必须小心,因为某些字段(如姓氏)并不总是唯一的。
- 组合键或复合键是由两个或多个字段连接在一起形成的。当任何字段中的数据项不能保证是唯一的时,它被使用。例如,组合键可以由诸如性别和出生日期之类的字段组成。
- 主键是一个单键/唯一键或复合键,必须有值。主键不能为空或为 null。
- 次要键是一个包含有用数据项的字段,通常用于搜索。与其他键不同,次要键并不总是唯一的。
关系数据库使用一系列相关表格来组织数据。在表格之间建立关系,以提供一种灵活的方式来操作和组合数据。表单用于查看、输入和更改表格中的数据。关系数据库是最常用的数据库结构。关系数据库中数据的组织涉及一个模式。
模式(发音为“skee-ma”)是数据库的数据定义。它是整个数据库的有组织的计划,显示了数据的查找位置和方式、数据的描述以及数据的逻辑关系。在关系数据库中,模式定义了实体、属性和关系。
- 实体是关于其收集和存储信息的事物。学校数据库中有一个实体代表学生、教师、班级以及学生和班级。平面文件数据库将为这些实体中的每一个创建单独的文件。
- 属性是实体的定义属性。学校数据库中的学生实体具有诸如 LastName、FirstName 和 PhoneNumber 之类的属性。实体的每个属性都包含一个数据项。属性与平面文件数据库中的字段相同。
- 关系是实体彼此关联的方式。在学校数据库中,实体使用键(例如 StudentID)相关联。实体以三种方式相关联。
- 一对一关系是指第一个实体中的每条记录与第二个实体中的恰好一条记录相关联。例如,在小学中,每个班级只有一名教师,每名教师只与一个班级相关联。
- 一对多关系是指第一个实体中的一条记录与第二个实体中的多条记录相关联,但第二个实体中的任何记录只与第一个实体中的一条记录相关联。例如,一个学生可以从图书馆借阅许多书籍,但任何一本书一次只能被一个学生借阅。
- 多对多关系是指第一个实体中的每条记录与第二个实体中的多条记录相关联,第二个实体中的每条记录与第一个实体中的多条记录相关联。例如,每个学生学习许多科目,每个科目都被许多学生学习。
外键是一个表格的属性(字段),它是另一个表格的主键。在学校数据库中,StudentID 属性是学生和班级表格的外键,也是学生表格的主键。一个表格的外键中的数据必须与另一个表格的主键中的数据匹配。
次要键是一个被识别为适合为数据建立索引的字段,例如姓氏。它用于以不同于主键的顺序对数据进行排序。事实上,一个表格可以有多个次要键,每个字段都可以是次要键。
有关实体的信息显示在表格中。表格是将数据组织成列和行的形式。它有时被称为关系。表格的列也是实体的属性或记录的字段。列中的数据必须具有相同的数据类型并具有不同的名称。表格中的一行也称为实体的元组或一条记录。每一行必须由一个键唯一标识。一行和一列的交点存储一个特定数据项,例如学校数据库第一行第二列的“Rebecca”。表格中的行和列可以以任何顺序查看,而不会影响表格的内容。
使用表单以不同的目的查看数据。表单用于查看、输入和更改表格中的数据。表单的布局可以更改。用户可以定位字段、标题、说明和图形。精心设计的表单提供有关所需数据和适用于特定字段的任何数据输入规则的信息。例如,字段名称“性别 (M/F)”清楚地说明了所需的数据类型以及如何输入。在关系数据库中,表单可以基于单个表格或多个表格。
数据独立性
消除数据冗余
更轻松地维护数据完整性
集中式安全 - 更大的数据控制
体积庞大
成本高
需要更多硬件
故障影响更大
数据建模是识别实体、实体之间的关系以及实体的属性的过程。它用于开发数据库的模式。数据建模对于创建高效的数据库至关重要。有许多用于数据建模的工具,例如数据字典、示意图和规范化。
数据字典是数据库中每个字段(属性)的全面描述。它包含有关数据库中每个条目特征的信息,例如字段名称、字段大小、数据类型和字段描述。
- 字段名称是字段的名称。应仔细选择它,以避免混淆。字段名称应相对较短,但清晰且无歧义。
- 数据类型(或字段类型)是可以存储在字段中的数据类型。每个字段都以单个数据类型存储数据。一些常见的数据类型包括文本、备忘录、数字、货币、是/否和日期/时间。逻辑字段包含逻辑值“真”或“假”。
- 数据格式显示数据的显示方式。
- 字段大小或宽度是指每个字段允许的字符数。它应限制在可能需要的最少字符数,因为较小的字段大小可以让数据库运行得更快。
- 描述指定字段的内容。
- 示例提供字段中有效条目的示例。
数据字典是数据库开发中的一项基本工具。它包含元数据,即有关数据的信息。它为同时参与项目的每个人提供了一个共同的基础。例如,如果人们正在处理不同的实体,他们可以参考数据字典以检查特定属性是否已存在。这减少了数据库中的数据冗余(任何不希望的数据重复)。
示意图是帮助定义数据库并开发模式的图形工具。一种常见的示意图称为实体关系图。实体关系图 (ERD) 是一种识别实体并显示实体之间关系的图形方法。它有助于确定要包含在数据库中和从数据库中排除的数据。ERD 强制人们对数据库有一个共同的理解。它们是解释数据库的有用工具。ERD 有多种表示法。
规范化是将数据组织成表格的过程,以便使用数据库的结果是明确的且符合预期。这是一个细化过程,旨在减少数据冗余。规范化会导致一个更高效但更复杂的数据库,因为数据被分离到更多表格中。例如,一个表格用于跟踪客户购买和产品的价格。如果你删除了一个客户,你也会删除一个价格。规范化将通过将此表格分成两个表格来解决这个问题:一个表格是关于每个客户及其购买的商品,另一个表格是关于每种商品及其价格。对任一表格进行添加或删除都不会影响另一个表格。规范化程度已按形式定义,例如
- 第一范式 (1NF) - 将数据项移到单独的表格中,其中每个表格中的数据都是类似类型。每个表格都分配了一个主键。1NF 是规范化的基本级别,通常对应于数据库的定义。
- 域/键范式 (DKNF) - 键唯一地识别表格中的每一行。域是每个属性的允许值集合。强制执行键和域限制可确保在修改数据库时不会出现问题。DKNF 是大多数设计人员力求实现的最终规范化级别。
超媒体是将多种媒体的链接地址进行电子化连接,提供了一种简单方便的信息导航方式。信息存储在一个包含文本、图像、音频、视频或可执行程序的文件集中。每个文件都是独立的,信息通过超文本检索。超文本是一种系统,它允许文档相互交叉链接,用户可以通过点击链接从一个文档跳转到另一个文档。链接,或超链接,通过突出显示的项目(通常是带下划线的单词或图形)来指示电子连接。超文本作者必须指定每个链接所访问信息的地址。如果另一个计算机是链接的目标,则该计算机称为节点。超媒体和超文本最著名的应用是万维网。在网络上,每个文档都通过其统一/通用资源定位符 (URL) 访问。
网页使用超文本标记语言 (HTML) 创建。HTML是一组特殊的指令,指示如何显示和导航文档的各个部分。HTML 文档实际上是包含 HTML 指令的文本文件。许多应用程序将以 HTML 格式保存文档并插入特殊指令。HTML 文档在 Web 浏览器中查看。HTML 编辑器是一种专门用于编写 HTML 代码的软件程序。HTML 中的指令使用 HTML 标签给出。HTML 标签是元数据,或关于数据的信息。标签由左尖括号 (<)、标签名称和右尖括号 (>) 组成。标签通常成对出现,例如 <H1> 和 </H1>,用于开始和结束标签指令。结束标签看起来像开始标签,只是在括号内的文本前面有一个斜杠(/)。每个 HTML 文档都包含某些标准标签,例如 <head> 和 <body>。<head> 标签位于标题之前,<body> 标签指示实际文本的开始。
URL 是 Web 上文件或资源的地址。它通常以小写字母书写,作为一条完整的无空格的线。URL 的主要部分是
- 协议 - 用于访问 Web 上特定资源的传输方法。在大多数情况下,协议将是“http://’(超文本传输协议)。
- 域名 - 资源所在的特定计算机的地址,例如“www.hi.com.au”。域名可以用 IP 地址代替。
- 文件路径 - 要检索的文件的完整路径。它可能是一个简单的文件名,也可能是一个目录路径,例如“atlas/about.htm”。域名和文件路径之间用正斜杠 (/) 分隔。
URL 必须完整且准确;如果不是,则找不到文件或资源。不必记住 URL。Web 浏览器具有存储网站地址的功能。这些存储的 URL 被称为书签或收藏夹,可以组织到类别或文件夹中以节省您的时间。
故事板是一系列框架,每个框架代表不同的动作或屏幕图像。它是一个用于组织超媒体的工具。故事板绘制在纸上或使用计算机。它们经常被编辑。它们定义每个屏幕及其特定的媒体类型。故事板由导航路径、信息和图形组成。它们很受欢迎,因为它们易于构建,易于阅读,并且可以在每个阶段进行修改。有四种故事板布局
- 线性 - 一个简单的顺序路径,可以快速设置
- 分层 - 顶部到底部设计的顺序路径;用户从开头开始,向下移动到多媒体产品
- 非线性 - 无结构;用户可以在任何方向在不同的布局之间移动
- 组合 - 以上布局的融合。
数据库管理系统用于提供安全高效的方法,从数据库中存储和检索信息。
数据库管理系统 (DBMS)- 是一种软件包,允许用户访问数据库,以便他们可以输入、维护和查看数据。在 DBMS 中,数据被组织成表,在表单中查看,使用查询检索,并在报告中显示。DBMS 以多种方式操作数据,例如搜索和排序。它们还执行许多任务以帮助用户开发和维护数据库
- 使用数据字典组织数据
- 使用示意图显示实体之间的关系
- 检查数据输入中可识别的错误
- 允许灵活地更改数据库的定义
- 限制授权人员对数据的访问
- 提供有关数据库性能的信息。
- 顺序访问是指按照顺序访问数据。数据按照存储顺序访问。它不需要数据项的确切位置。顺序访问比直接访问慢得多,在需要立即处理的情况下不实用。这是访问存储在磁带上的数据的唯一方法。
- 直接访问是指在不访问先前数据项的情况下访问数据。数据根据数学过程或算法存储在特定的存储位置。直接访问使用此算法来计算数据的近似位置。如果在此处找不到数据,计算机将搜索后续位置,直到找到它。直接数据通常需要使用索引,这称为索引访问。
- 索引- 是一个包含有关数据位置信息的表。通过参考索引并获取数据的精确位置来访问数据。索引方法广泛用于在磁盘上存储数据,以及存储数据库中数据的逻辑位置。
分布式数据库- 是位于多个站点上的数据库。它们充当单个数据集合,这些数据在地理上分散。分布式数据库减少了如果所有站点的所有用户都必须访问一个集中式数据库而产生的数据传输成本。但是,它们使得更难获得数据库的完整视图。分布式数据库通常需要同步以保持其最新状态。两阶段提交是 DBMS 的一部分,用于维护分布式数据库的一致性。它检查数据库的两个部分是否都已准备好传输,然后执行传输。
- 在线存储使用用户直接控制的外部设备,例如硬盘驱动器。
- 离线存储使用用户不直接控制的外部设备,例如集中式数据库。
在线和离线存储都使用各种外部设备和存储介质
- 硬盘- 是一种由金属或玻璃制成的存储设备,表面覆盖有磁性材料。通常安装或固定在具有存储容量(以 Gb 为单位)的机箱中,并使用直接访问进行访问。
- 光盘- 是一种聚碳酸酯塑料磁盘,表面覆盖有金属反射层。数据使用激光读取和写入,数据使用直接访问检索。类型
- CD-ROM(光盘只读存储器)为 12 厘米,可存储 650 兆字节。方便存储恒定数据。
- DVD-ROM(数字通用光盘只读存储器)与 CD 的物理尺寸相同,但存储介于 4.7 兆字节和 17 兆字节之间。
- 可移动盒带- 是一种硬盘,外壳为塑料或金属盒带,可以像软盘一样拆卸。速度快(但不像固定硬盘那么快),使用直接访问。两种类型
- 磁盘存储 100 或 250 兆字节的数据,传输速率为 1 兆比特每秒。 - Jaz 磁盘是 Zip 的升级版本。它们存储高达 2 千兆字节的数据,传输速率为 5.5 兆比特每秒。
- 磁带 - 是一条非常薄、长的塑料带,表面涂有一层薄薄的磁性材料。磁带绕在盒式磁带内的 2 个卷轴上。它们可以以低成本存储大量数据,使用顺序访问,通常用作备份介质。
加密和解密
[edit | edit source]加密是指对数据进行编码的过程,解密是指对数据进行解码的过程。这是实现数据安全的最有效方法。数据被编码、传输,然后转换回其原始形式。加密对于金融交易至关重要,在互联网上广泛使用。方法通常涉及对位模式的复杂操作。一个问题是找到一种方法,这种方法既难以解码又便于使用。两种主要类型
- 非对称加密需要一个用于加密的密钥和一个用于解密的密钥。常用方法是公钥加密,它涉及一个广泛可用的公钥用于加密,以及一个保密的私钥用于解密。两者都是使用复杂的数论开发的。
- 对称加密对加密和解密使用相同的密钥。常用方法是数据加密标准 (DES)。
数据备份和安全
[edit | edit source]备份 - 是数据的另一个副本,可用于重建系统。DBMS 包含备份和恢复功能,其中备份在指定时间创建。如果系统发生故障,恢复过程将重建数据。它使用最后完成的备份和一个日志,该日志列出了自上次备份以来 DBMS 完成的所有操作。备份和恢复的成功取决于实施适当的程序。备份通常存储在异地或防火保险箱中。备份消除了替换数据的需要,而替换数据是一项非常昂贵的操作。
数据安全 - 包含一系列保护数据的安全措施。首先,使用密码、个人物品和生物识别设备限制授权用户的访问。进一步的安全措施包括加密和防火墙。
- 防火墙 - 检查任何试图访问网络的人的密码(也可以用于互联网),以验证和验证传入的数据。安装和维护成本高昂。大型系统需要不止一个,因为需要在关键点设置障碍。
数据备份
[edit | edit source]防火墙
[edit | edit source]用于操作数据的工具
[edit | edit source]排序
[edit | edit source]排序是指按特定顺序排列数据的过程。在数据库中,有意义地组织数据更容易使用。排序按升序或降序进行。排序可以在多个字段(属性)上进行,以便按最有效的方式排列记录。
搜索
[edit | edit source]搜索是指检查数据库以检索数据的过程。在小型数据库中,执行此操作的有效方法是浏览或使用“查找”或“搜索”命令。在大型数据库中,它使用查询完成。
查询示例
[edit | edit source]结构化查询语言
[edit | edit source]查询 - 是对数据库的搜索,以查找符合特定条件的记录。这是您向数据库提出的问题。结果通常显示在表格中,但可以用作表单、报表、图表或其他查询的基础。查询还可以同时更新或删除多个记录,并对数据执行计算。查询以以下形式构建:-
<Field name> <Operator> <data>.
数据通常称为条件。构建查询的常用方法是查询示例,这要求用户在字段旁边输入条件。如果对数据库的搜索涉及两个或多个实体,则称为关系查询。
查询语言 - 是一种专门设计用于搜索数据库的语言。
结构化查询语言 (SQL) 是一种用于访问和操作关系数据库中数据的查询语言。SQL 语句包含用于执行特定任务的关键字。在 SQL 中搜索时,务必使用正确的语法。在大多数 DBMS 中,关键字为大写,字段用逗号分隔,实体和该实体中的属性用句号分隔,搜索条件或数据项用双引号括起来。关键字 ORDER BY 按升序 (ASC) 或降序 (DESC) 对字段进行排序,默认情况下为升序。
操作符用于构建某些查询。操作符表示要执行的操作。操作符分类为关系运算符或逻辑运算符
- 关系运算符 (=, <>, <, >, <=, >=) 是表示两个表达式之间关系的字符或符号。
- 通配符代表一个或多个未知字符。常用的通配符包括 (*),它替代任意数量的字符,以及 (?),它替代只有一个字符。
- 逻辑运算符 (AND、OR、NOT) 用于组合查询,以便在多个字段上执行搜索。理解 AND 和 OR 运算符之间的区别很重要
- AND 运算符要求第一个和第二个查询都为真,因为它检索满足两个条件的记录。
- OR 运算符要求第一个或第二个查询为真,因为它检索满足其中一个条件的记录,例如“姓氏 = Howe”或“郊区 = Kearns”。
- 示例
SELECT ARTWORKS.ArtisName, ARTWORKS.ArtistSurname, GALLERIES.GalleryName, ARTWORKS.Cost //SELECT 属性
FROM GALLERIES INNER JOIN ARTWORKS ON GALLERIES.GalleryID = ARTWORKS.Gallery //FROM 实体
WHERE (((ARTWORKS.Cost)>5000)) //满足这些条件
ORDER BY ARTWORKS.ArtisName DESC; //ASC 或 DESC 顺序
使用搜索引擎
[edit | edit source]搜索引擎 - 是一个包含已索引网站的数据库,允许关键字搜索。搜索引擎用于搜索超媒体。索引是一个表,其中包含有关数据位置的信息。索引允许使用关键字搜索找到文档。搜索引擎的索引是通过定期扫描网络以查找新网站并接受网页作者提交的网站来构建的。扫描通常由称为蜘蛛、爬虫或机器人的程序完成。它们将找到的任何文档的 URL 发送回搜索引擎的索引软件。此索引软件从网站收集信息,例如标题和关键字,然后在数据库中对其进行索引。每个搜索引擎都采用不同的方法来构建其索引,这就是为什么使用不同的搜索引擎搜索相同的关键字会得到不同结果的原因。输入与感兴趣的主题相关的关键字。大多数搜索引擎允许在一系列关键字上进行搜索。当用户请求关键字时,搜索引擎会扫描索引并显示包含该关键字的网站列表。选择合适的关键字对于搜索的成功至关重要。应使用多个单词、同义词,并且应该非常具体。搜索引擎允许使用布尔运算符,例如“AND”、“OR”和“NOT”来细化搜索。一些搜索引擎还提供词典。
词典是按类别组织的网站列表(例如,体育)。它们是查找网络信息的另一种方式。网站所有者需要注册网站才能将其包含在目录中。因此,目录通常只涵盖网络上可用页面的很小一部分。目录对于查找有关一般主题的信息很有用。
搜索引擎如何工作?
[edit | edit source]搜索机器人 - 是一个访问网站并收集信息以供搜索引擎索引的程序。Alta Vista 使用一个名为 Scooter 的机器人。
细化搜索
[edit | edit source]显示是指将信息系统或数据库的输出结果呈现出来,以满足特定目的。
报表 - 是对数据进行格式化和组织后的呈现(例如发票)。DBMS允许对报表进行完全控制,可以以表格或列的形式进行设计。可以插入标题、对数据进行排序、选择字段、切换字段、更改列宽以及选择记录。报表的用途决定了其内容、格式和样式。在创建报表之前,用户需要通过构建查询来选择所需的记录。接下来,他们选择字段,将字段放置在适当的位置,进行格式化和排序。大多数DBMS都提供诸如计数和求和之类的功能。大多数DBMS报表都包含以下部分
- 报表页眉 - 在报表开头只出现一次。它包含诸如徽标、报表标题和日期之类的项目。
- 页眉 - 显示诸如标题、列标题或每页顶部所需的任何信息。出现在报表页眉之后,位于报表的首页。
- 详细信息 - 部分显示大部分信息。
- 页脚 - 显示诸如日期、页码或任何其他在每页底部需要的信息。
- 报表页脚 - 在报表结尾只出现一次,位于最后一页的页脚之后。它显示诸如报表总计之类的项目。
不同视图 的数据库是使用窗体构建的。窗体用于查看、输入和更改表中的数据,并且可以更改布局。用户可以定位字段、标题、说明和图形。设计精良的窗体可以提供有关所需数据的解释,以及适用于特定字段的任何规则。良好的设计原则包括
- 标识报表目的的标题
- 诸如表格或列之类的布局,可以有效地呈现信息
- 水平或垂直平衡的页面文本
- 报表中一致的样式
- 带有清晰描述性标题的列
- 适当的空白
- 页眉中的页码和日期,以及页脚。
数据源 - 是开发数据的个人或组织。数据可能来自非正式来源,例如对话、会议或观察,也可能来自正式来源,例如报告、书籍或官方文件。正式来源通常提供逻辑组织的数据。但是,无法保证其准确性。数据来源受版权法保护。未经许可,人们不能复制他人的作品,违反版权是非法的。网络上的大多数数据受版权保护。未经所有者确认和许可,不得使用网站上的文本、音频等。但是,版权法对学生使用信息进行研究做出了特殊规定。如果正确引用,学生被允许使用原始作品的合理部分。这包括作者的姓氏和首字母或组织的名称、完整作品或网页的标题、URL、文档日期和下载日期。
数据访问 指的是数据对人们的可用程度。信息自由法案旨在允许个人了解政府和其他公共机构正在保存哪些数据。它规定,个人有权访问与个人相关的信息,但不得侵犯他人的隐私。这些信息可以免费发布。然而,知道保存了哪些数据并不意味着知道它是如何使用的。人们可以使用我们的偏好、弱点和习惯来为自己谋利。此类数据的拥有权和控制权是一个伦理问题。
隐私 是指个人控制个人数据的权利。对于那些与数据库打交道的人来说,这是一个主要关注点,尤其是在数据库链接导致隐私侵蚀的情况下。
数据完整性 描述了数据的可靠性。可靠的数据是准确的、最新的和相关的。无法保证互联网上的信息是可靠的,因为在互联网上很容易发布信息。
数据验证 用于检查数据的输入。
- 范围检查 - 如果数据限制在特定值的较小范围内,则使用该方法。
- 列表检查 - 当数据可以与一组可接受的数据进行比较时使用该方法。
- 类型检查 - 用于确定数据类型是否正确。
- 校验位 - 是根据代码数字中的数字计算得出的数字,然后作为额外数字添加到该数字中。
数据的准确性 - 指其没有错误的程度。收集的个人数据并不总是准确的。这种不准确可能是由于收集或输入数据时出错、数据与个人不匹配或信息过时造成的。应提供检查和更改不正确数据的机会。通常需要比较来自多个不同来源的数据,以确定哪些数据是准确的。
数据仓库 是从不同数据源收集信息的数据库。它是一个原始数据的存储区域,可以对其进行分析,以帮助组织做出决策。数据仓库的内容通常是历史性的和静态的,如果发现新的需求,它将发生变化。获取信息的更复杂方法是数据挖掘。
数据挖掘 是一个寻找数据库中存储的数据之间关系和模式的过程。它对数据进行排序,并找出有趣的和有用的联系(例如,在超市的交易中)。一个问题是,许多模式是偶然发生的,在决策中没有价值。它引发了隐私和数据所有权的问题。]
OLTP 指的是优化数据库以提高在线性能。根据http://www.databasejournal.com,这种优化包括将数据组织成多层。
- 业务逻辑层 – 规则和流程,经过优化,可以快速处理频繁请求
- 表示层 – 客户端唯一执行的操作
- 数据层 – 处理事务所需的所有数据
OLAP 是关于分析历史数据,以提取信息。过去,这是一个缓慢的过程,因为经过适当规范化的数据库将数据存储在离散的表中。它通过基于实际数据库快照预先构建数据集来实现这一点。文件大小会膨胀,因为数据不再规范化,但查询速度快得多。
更多信息请访问
http://www.ebroadcast.com.au/lookup/encyclopedia/ol/OLAP.html
http://office.microsoft.com/en‐au/excel/HP101774371033.aspx
向下钻取是指获取一组概括结果并深入查看这些结果的一部分。例如,“5 月的降雨量相对较高”包含一些信息。如果你问,“是整个月都在下雨,还是间歇性地下的?”,你就正在向下钻取。
进一步向下钻取可以查看降雨量的逐日、逐时或逐分钟分析。有一个很好的演示在
http://www.quietlyscheming.com/blog/charts/chart‐drilldown‐animations/