跳转到内容

GCSE 计算机科学/数据存储

0% developed
来自维基教科书,开放书籍,构建开放世界
规范链接

理解声音(音乐)、图片、视频、文本和数字存储在不同的格式中 - 2016 年 CIE 教学大纲第 10 页

声音(音乐)、图片、视频、文本和数字存储在不同的格式中,具体取决于存储的内容。

错误检测

[编辑 | 编辑源代码]
规范链接

识别和描述错误检测和纠正方法,如奇偶校验、校验位、校验和和自动重发请求 (ARQ) - 2016 年 CIE 教学大纲第 10 页

奇偶校验

奇偶校验是一种用来检查数据在从一个设备或介质传输到另一个设备或介质后是否发生改变或损坏的方法。一个数字的奇偶校验要么是奇数,要么是偶数,在奇偶校验中,会添加额外的“位”来保证 1 的数量始终是奇数或偶数。

一种方法是在传输发生之前,将每个数据字节中的一位分配为奇偶校验位(也称为校验位)。奇偶校验是在发送方和接收方之间决定的。具有偶校验的字节中 1 的数量是偶数。相反,具有奇校验的字节中 1 的数量是奇数。例如,以下字节省略了第一位。

_ 1 1 0 1 1 0 0

如果发送方同意使用偶校验,那么我们注意到字节中目前有偶数个 1,所以第一位应该是 0。

0 1 1 0 1 1 0 0

如果发送方同意使用奇校验,那么第一位应该是 1。

1 1 1 0 1 1 0 0

如果一个字节以一种奇偶校验发送,而接收方以另一种奇偶校验接收,则一定发生了错误,接收方可以要求重新发送数据。这种方法的问题是无法确定哪一位发生了错误。也就是说,任何一位都可能在传输过程中发生变化。此外,如果改变了不止一位,那么字节可以保留相同的奇偶校验。例如,以下两个字节具有相同的奇校验,尽管它们明显没有携带相同的数据。

1 1 1 0 1 1 0 0
1 1 1 0 1 1 1 0

奇偶校验块可以用来定位错误并进行纠正,假设每一行和每一列只改变了一位。假设在以下示例中同意使用偶校验。

奇偶校验位 位 2 位 3 位 4 位 5 位 6 位 7 位 8
字节 1 1 1 1 1 1 1 1 0
字节 2 0 0 1 1 0 0 1 1
字节 3 1 1 0 0 0 0 1 0
奇偶校验字节 0 0 0 0 1 1 0 1

如上所示,可以看出位 7 行和字节 3 列存在错误。它们在 (位 7,字节 3) 处相交。因此,可以将该位纠正为 O,接收方可以纠正错误。由于如果改变了不止一位,则可能不会给出错误,因此在检查传输数据的错误时需要其他方法。

自动重发请求 (ARQ)

这使用确认(接收方发送的消息,表明消息已正确发送)和超时(允许在收到确认之前经过的时间)。如果发送方在规定的时间内没有从接收方收到确认,则会自动重新发送消息。

校验和

  • 数据以块的形式发送,还会发送一个称为校验和的附加值。
  • 在一个字节中可以存储的最大值为 255。在以下过程中省略了值 0000 0000。

如果所有字节的总和 <= 255,则校验和为该值,否则执行以下过程。

  1. 将该值除以 256 并找到商(除并截断)。
  2. 将新的整数值乘以 256。
  3. 找到所有字节的原始总和与使用此算法找到的值之间的差。这就是校验和。

不同文件类型的概念

[编辑 | 编辑源代码]

文本文件

[编辑 | 编辑源代码]

文本和数字文件格式

  • 使用无损文件压缩。
  • 文本通常以 ASCII 格式存储。

数字可以存储为

类型 示例
实数 2.5454545
日期 12/08/2122
时间 19:00:20
货币 $15.50

图片文件

[编辑 | 编辑源代码]

联合图像专家组 (jpeg)

图片分辨率是图片的细节程度 - 通常以每厘米像素数来衡量。

  • JPEG 是一种用于图像的有损文件格式。
  • 文件大小的减少会导致质量的下降。JPEG 依赖于人眼的特性(例如,当颜色达到一定的相似程度时,人眼无法分辨它们之间的差异),并且在一定程度上,没有观察到实际的质量损失。

未压缩的图像称为原始位图。位图图像在转换为 JPEG 时,会根据其原始质量减少 5 到 15 倍。

  • 一张 300 万像素的照片是一张 2048 像素宽、1536 像素高的图像,即 3145728 像素(因此略大)。由于每个像素包含 3 种颜色(红、绿、蓝),所以总文件大小为 兆字节 = 9 兆字节。

音频文件

[编辑 | 编辑源代码]
规范链接

理解 MIDI 文件、JPEG 文件、MP3 和 MP4 文件的概念 - 2016 年 CIE 教学大纲第 10 页


乐器数字接口 (MIDI)

MIDI 是一种通信协议,允许电子乐器相互通信。它包含一个指令列表,指示设备如何产生特定声音或音符。

  • MIDI 文件不是音乐,也不包含任何“声音”,因此它们与 MP3 文件非常不同。
  • 它使用 8 位串行传输,并且是异步的。
  • MIDI 在 16 个不同的通道(编号为 0 到 15)上运行,所有这些通道都可以同时使用,即 16 个设备都使用音乐音序器演奏歌曲中的不同音轨。
  • MIDI 文件比 MP3 文件小得多,这使得它们非常适合存储音乐文件,在这些文件中存储空间是一个问题,例如在手机上存储铃声。
  • 每个 MIDI 文件都有一个特定的字节序列
    1. 第一个字节是状态字节 - 通知 MDI 设备执行什么功能 - 其中还编码了 MIDI 通道。
    2. 音高字节指定要演奏的音符。
    3. 力度字节指定演奏音符的响度
  • 所有这些都保存在一个扩展名为 .mid 的 MIDI 文件中

MPEG-3 (MP-3)

  • 它是一种有损格式。
  • 使用音频压缩软件将音乐和其他声音转换为 MP3 文件格式。
  • 使用文件压缩软件转换 CD 文件
  • 这大大减少了文件大小(约 90%)。
  • 这是通过感知音乐整形来实现的,它会降低人耳无法正常听到的声音,即如果同时播放更响亮的声音,则会消除更安静的声音。人耳只能听到更响的声音。
  • 比特率是在创建文件时使用的比特数。它们通常为每秒 80 到 320 千比特;任何高于 200 的值都会产生接近普通 CD 的声音质量。

MPEG-4 (MP-4)

  • 它是一种有损格式。
  • 可以存储音乐、视频、照片和动画(多媒体文件格式)。


无损和有损文件压缩

[编辑 | 编辑源代码]
规范链接

理解应用于音乐/视频、照片和文本文件的 数据压缩原理(无损和有损压缩算法) - 2016 年 CIE 教学大纲第 10 页

无损数据压缩 解压缩文件时,会重建原始文件中的所有数据位。这对于任何数据丢失都是灾难的文件很重要,例如电子表格。

例如,在文本文件中,重复的单词或部分单词也可以用更短的东西替换,例如 'the' 可以替换为 '1'。

有损数据压缩

该算法会消除不必要的数据位。

在 MP3 文件中,这以感知音乐整形的形式出现。在 JPEG 文件中,这取决于人类视觉的局限性。在 MP4 文件中,使用各种方法,例如去除每帧中的一些颜色信息。

华夏公益教科书