数据表示基础：声音压缩

试卷 2 - ⇑ 数据表示基础 ⇑
← 采样声音	声音压缩	奈奎斯特定理 →

如您所见，我们对声音文件的大小存在一些严重的问题。看看一个以 44 kHz 采样率和 16 位采样分辨率录制的三分钟流行歌曲的大小。

44,000 * 16 * 180 = 126 720 000 bits (15.84 MB)

您可能已经知道，相同长度的 mp3 大约只有 3Mb，只有原始文件大小的五分之一。那么是什么原因呢？很容易看出，声音的原始文件大小太大，难以存储和传输，需要一种方法来压缩它们。

无损压缩

无损压缩 - 压缩不会丢失任何精度，并且可以解压缩成与原始音频数据完全相同的副本

WAV 文件根本不涉及任何压缩，大小与您已经计算过的文件大小相同。存在一些无损压缩的文件格式，例如 FLAC，它将 WAV 文件压缩成通常为原始大小 50% 的数据。为此，它使用 游程长度编码，它寻找声音文件中重复的模式，并且不是分别记录每个模式，而是存储关于模式在行中出现次数的信息。让我们以一组假设的采样点为例

0000000000000000000001234543210000000000000000000123456787656789876

如您所见，静音区域占据了文件的大部分，而不是分别记录这些区域，我们可以设置数据来声明静音采样在行中出现的次数，从而大幅减少文件大小

(21-0)123454321(17-0)123456787656789876

FLAC 文件使用的另一种技术是线性预测.

有损压缩

FLAC 文件仍然非常大，需要一种格式，使您可以创建更小的文件大小，以便轻松地存储在您的计算机和便携式音乐设备上，并轻松地通过互联网传输。

有损压缩 - 压缩会丢失文件精度，通常比无损压缩更小

正如我们已经看到的，为了制作更小的音频文件，我们可以降低采样率和采样分辨率，但我们也看到了这会对最终声音产生的可怕影响。存在其他巧妙的方法来压缩声音，这些方法无法让我们完全获得我们开始时的音频，但会非常接近。这就是有损压缩。

存在许多有损压缩的音频格式，包括：MP3、AAC 和 OGG（这是开源的）。压缩通过降低被认为超出大多数人听觉分辨率能力的声音的某些部分的精度来实现。这种方法通常称为 感知编码。它使用心理声学模型来丢弃或降低对人类听觉来说不太明显的成分的精度，然后以有效的方式记录剩余的信息。由于某些频率的精度会丢失，因此您通常可以分辨出原始版本和有损版本之间的区别，能够听到高音和低音的丢失。

练习：声音压缩

为什么有必要压缩声音文件？

回答

这样它们占用的空间更小，可以快速通过互联网发送或存储在便携式音乐播放器上

列出两种可用的压缩类别，并分别给出一种文件格式

回答

有损压缩 (mp3/AAC/ogg) 和无损压缩 (FLAC)

对以下声音文件执行游程长度编码

012344444444444432222222222222211111111111111000000000000

回答

0123(11-4)3(13-2)(14-1)(11-0)

描述一种用于压缩 mp3 文件的技术

回答

感知编码降低了存储在声音文件中的超出大多数人听觉分辨率能力的频率的质量

何时最好使用 FLAC 而不是 ogg，反之亦然？

回答

当您非常在意声音质量，并且不介意文件大小的时候
当您试图使声音文件尽可能小的时候