数据编码理论/数据压缩
外观
< 数据编码理论
在传输数字数据时,我们发现我们往往无法像我们希望的那样快速地发送信息。特定的限制,例如香农信道容量,限制了可以在给定信道上传输的数字信息量。因此,如果我们想要传输更多数据,我们需要找到一种方法来使我们的数据更小。
为了使数据更小,我们实施了许多称为数据压缩的技术。存在许多不同的压缩算法,但它们都可以分解为两类:无损算法和有损算法。
压缩的基本功能是去除冗余,其中冗余是所有可以去除或以不同方式表达的内容,但不会去除其含义。
有损算法是可以用来传输数据“相当好”版本的技术。对于有损算法,在转换中总是会丢失一定量的数据。有损算法比无损算法提供更高的压缩率,但缺点是必须丢失信息才能获得这些高压缩率。有损压缩算法的一个例子是 .jpeg 图片文件或 mp3 音乐文件。如果有损算法足够好,接收者可能无法察觉到损失。
无损算法减小给定信号的大小,同时不丢失任何原始信息。因此,无损压缩算法优于有损算法,尤其是在数据需要完整到达接收者时。无损压缩算法的例子包括 ZIP 文件和 GIF 图片。
游程编码 (RLE) 可能是最著名的压缩技术之一。以下是它的工作原理:假设我们有一些输入数据:'aaaabbbc' 现在 RLE 通过表达每个符号出现的次数来压缩它,如果它出现超过 2 次。这被 '压缩' 为 '4a3bc',这意味着 4 x a,3 x b,1 x c。如果数据项出现两次或只有一次,我们不会明确地表达它。我们只会浪费空间。
霍夫曼编码是一种非常强大的压缩技术,可以用作最佳的无损编码技术。它试图用更少的位数分配给最常出现的词语(数据),而用更多的位数分配给最不常出现的词语。
维基百科上的霍夫曼编码:w:霍夫曼编码
数据压缩虽然与编码理论相关,但严格来说不属于本书的范围,因此我们在这里不再深入讨论。
- 数据压缩
- hydrogenaudio 维基有一个 流行无损音频压缩编解码器比较。
- 数据压缩维基
- 数据压缩维基