JPEG - 构思与实践/制作灰度文件的程序
现在来看看能够生成灰度 JPEG 文件的程序。我们假设图片的宽度和高度都能被 8 整除,并设置 wid8 = width div 8 和 hei8 = height div 8。我们还假设颜色值以位图内存块 pb 的形式给出,因此屏幕坐标为 (i, j)(i = 0, ..., width-1, j = 0, ..., height-1)的点的颜色值(字节)为 pb[(height-1 - j) * width + i]。更准确地说:我们假设图片以 BMP 格式给出为彩色图片,我们只使用它在能被 8x8 方格均匀分割的最大区域内的部分,我们通过取 RGB 值的平均值来构造 pb。
我们按以下顺序编写了标记(及其段):SOI、APP、DQT、DQT、SOF、DHT、DHT、SOS(有两个 DQT 和 DHT 段,因为有两个量化表和两个霍夫曼编码)。最后一个段 - SOS - 标记编码数据的流的开始,在此之后,文件以标记 EOI 结束。我们已经针对 DC 和 AC 编号计算了 EHUFSI[val] 和 EHUFCO[val][i] 数组,它们的大小分别为分配给霍夫曼值 val 的代码的大小和代码本身。在程序中,这些数组分别称为 ehufsid[val] 和 ehufcod[val](用于 DC 编号),以及 ehufsia[val] 和 ehufcoa[val](用于 AC 编号)。
对于具有坐标集 (i0, j0)(i0 = 0, ..., wid8-1, j0 = 0, ..., hei8-1)的 8x8 方格,以及方格内具有坐标集 (i, j)(i, j = 0, ..., 7)的点,屏幕坐标集为 (i0 * 8 + i, j0 * 8 + j)。对于每个 8x8 方格,我们都有一个 8x8 矩阵 f,它包含颜色值(有符号字节 - 我们从原始颜色值(级移)中减去了 128 以获得更小的数值),通过离散余弦变换、量化和舍入,我们得到一个 8x8 矩阵 g(u, v),它包含整数。这个过程(或更确切地说,函数)称为 costrans(f):g = costrans(f)。反之字形变换(iz: (i, j) → [1, ..., 64])由两个从 1 到 64 的数组 zx[l] 和 zy[l] 组成(这样 (zx[l], zy[l]) 的之字形变换为 l),由此,g 被转换为一个 64 数组 w(从 1 到 64)。w[1] 是 DC 编号,我们从它中减去前一个 DC 编号(存储在变量 dc 中),得到差值 diff。我们通过函数 digit(n) 获取整数 n 的二进制数字表达式,并将这个数组(从 1 到 size(n))插入到变量 c 数组中(从 1 到 10)。将位(形式为 c[j],其中 c 是代码字或数字表达式)写入文件(称为 fu)的过程表示为 wbit(bit) - 此过程使用(全局)变量 b0、b 和 q。costrans 和 wbit 的程序在扫描过程的程序之后显示。
- b0 = 0
- b = 0
- q = 256
- dc = 0
- for j0 = 0 to hei8 - 1 do
- for i0 = 0 to wid8 - 1 do
- begin
- for j = 0 to 7 do
- for i = 0 to 7 do
- f[i, j] = pb[(height - 1 - (j0 * 8 + j)) * width + (i0 * 8 + i)] - 128
- for i = 0 to 7 do
- g = costrans(f)
- for l = 1 to 64 do
- w[l] = g[zx[l], zy[l]]
- diff = w[1] - dc
- dc = w[1]
- val = size(diff)
- e = ehufsid[val]
- c = ehufcod[val]
- for j = 1 to e do
- wbit(c[j])
- if diff <> 0 then
- begin
- c = digit(diff)
- for j = 1 to val do
- wbit(c[j])
- end
- begin
- r = 64
- while (r > 1) and (w[r] = 0) do
- r = r - 1
- if r > 1 then
- begin
- l = 1
- m = 0
- while l < r do
- begin
- l = l + 1
- n = w[l]
- if n = 0 then
- begin
- m = m + 1
- if m = 16 then
- begin
- e = ehufsia[240]
- c = ehufcoa[240]
- for j = 1 to e do
- wbit(c[j])
- m = 0
- end
- begin
- end
- begin
- else
- begin
- k = size(n)
- val = m * 16 + k
- e = ehufsia[val]
- c = ehufcoa[val]
- for j = 1 to e do
- wbit(c[j])
- c = digit(n)
- for j = 1 to k do
- wbit(c[j])
- m = 0
- end
- begin
- end
- begin
- end
- begin
- if r < 64 then
- begin
- e = ehufsia[0]
- c = ehufcoa[0]
- for j = 1 to e do
- wbit(c[j])
- end
- begin
- for j = 0 to 7 do
- end
- begin
- for i0 = 0 to wid8 - 1 do
函数 costrans(f) 的程序,该程序对 8x8 矩阵 f[i, j](有符号字节)进行余弦变换和量化,得到 8x8 矩阵 g[u, v](整数),分为四种情况:u = 0 和 v = 0、u = 0 和 v > 0、u > 0 和 v = 0 以及 u > 0 和 v > 0。如果量化表的 64 数组称为 quant[k],之字形函数称为 iz(i, j),我们事先计算了矩阵 cq[i, j] = 4 * quant[iz(i, j)](i, j = 0, 1, ..., 7)(整数)和矩阵 cs[i, j] = cos((2 * i + 1) * j * pi / 16)(i, j = 0, 1, ..., 7)(实数)。g[u, v] 的四种情况的程序可以如下所示
- s = 0
- for i = 0 to 7 do
- for j = 0 to 7 do
- s = s + f[i, j]
- for j = 0 to 7 do
- g[0, 0] = round(s / (2 * cq[0, 0]))
- for v = 1 to 7 do
- begin
- s = 0
- for j = 0 to 7 do
- begin
- t = 0
- for i = 0 to 7 do
- t = t + f[i, j]
- s = s + cs[j, v] * t
- end
- begin
- g[0, v] = round(s / (sqrt(2) * cq[0, v]))
- end
- begin
- for u = 1 to 7 do
- begin
- s = 0
- for i = 0 to 7 do
- begin
- t = 0
- for j = 0 to 7 do
- t = t + f[i, j]
- s = s + cs[i, u] * t
- end
- begin
- g[u, 0] = round(s / (sqrt(2) * cq[u, 0]))
- end
- begin
- for u = 1 to 7 do
- for v = 1 to 7 do
- begin
- s = 0
- for i = 0 to 7 do
- begin
- t = 0
- for j = 0 to 7 do
- t = t + cs[j, v] * f[i, j]
- s = s + cs[i, u] * t
- end
- begin
- g[u, v] = round(s / cq[u, v])
- end
- begin
- for v = 1 to 7 do
最后是过程 wbit(bit),它将位“bit”(定义为字节,因为程序不处理位)写入文件 fu。我们从代码字或数字的数字中获取位,在插入文件之前,这些位被收集到 8 个块中,并转换为字节。我们称当前字节为 b(最初设置为 0),如果我们有一个从 256 开始的整数 q,并且在将每个位插入 b 之前,它被除以 2,那么添加(新)位意味着 b 必须增加 bit * q:b = b + bit * q。当 q = 1 时,b 被写入文件,q 再次设置为 256。如果 b = 255(8 个数字 1),则写入必须紧随其后的是写入零字节 b0(8 个数字 0)(字节填充),这样 255(在解码期间)就不会被误认为是标记的开始。写入过程 wbit 可能如下所示
- procedure wbit(bit: byte)
- begin
- q = q div 2
- b = b + bit * q
- if q = 1 then
- begin
- write(fu, b)
- if b = 255 then
- write(fu, b0)
- b = 0
- q = 256
- end
- begin
- end
- begin
程序以这个过程结束,这个过程在 q 未设置为 256(表示 b 尚未写入)时写入最后一个字节 b,并将 b 的其余位设置为 1(位填充)
- e = size(q) - 1
- p = 1
- for i = 1 to e do
- begin
- b = b + p
- p = 2 * p
- end
- begin
- write(fu, b)
如果最后一个字节 b 为 255,则它必须紧随其后的是零字节 b0。最后,我们写入标记 EOI = (255, 217)(图像结束)并关闭文件。