JPEG—范式哈夫曼编码（Canonical Huffman Code)

2024-04-09 15:32

文章标签 code 编码范式 jpeg 哈夫曼 huffman canonical

本文主要是介绍JPEG—范式哈夫曼编码（Canonical Huffman Code)，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

本文来自：https://www.cnblogs.com/k1988/archive/2010/05/18/2165646.html

在大部分介绍JPEG的中文书中都是将全部的JPEG的霍夫曼表给出，可是实际的JPEG文件头并不长，这个使得初看者很迷惑，这么短是如何存储那么长的霍夫曼表。其实，JPEG的霍夫曼表是由一定规则生成，只要给出少量的描述即可生成相应的JPEG的霍夫曼表。

在baseline的JPEG系统中采用Canonical Huffman Code（范式哈夫曼编码），而在扩展系统中采用算术编码。

首先介绍一下DC可变长度代码(VLI)编码，AC系数行程长度编码(RLE),首先要采用Zigzeg扫描，形成一维系数。扫描次序如下图所示：

（1）DC系数编码

对差分DC系数用两个符号进行编码。第1个符号表示“长度”，即为DC幅度进行编码需要的位数，符号2表示DC系数的幅度。

例如DC系数为20，那么经过VLI编码变成(5,20)。这个将用于下一步的Huffman编码。

（2）AC系数编码

类似地，对每个AC系数也采用两个符号进行编码，符号1和符号2.符号1表示了两条信息，分别称为“行程”和“长度”。行程是在之字形矩阵中位于非零Ac系数前的连续零值Ac系数的个数，长度是对Ac系数的幅度进行编码所用的位数。符号2表示了Ac系数的幅度。

例如一个块经过Zigzeg扫描得到AC系数如下: 1 0 -1 0 0 0 0 5 0 10，那么编码如下：（0/1，1），（1/1，-1），（3/3，5），（1/4，10），注意符号2表示负数用的是反码，也就是说如果-1，因为1的反码是0，所以-1的符号2为0。另外，如果一个块剩下的所有系数都是0，那么编码到最后一个非零系数，然后用EOB标识符标志块结束。在编码的过程中，如果连续0的个数超过15个，那么用（F/0）即ZRL符号来表示。如果在编码的过程中，形成0xFF的码，那么在0xFF后面添加00.

在编码的过程中，DC的符号1和AC的符号1采用的是Huffman编码。

（3）范式哈夫曼编码

1）生成规则

范式哈夫曼编码的规则是：长度为i的码字的前j位的数值大于长度为j的码字的数值，其中i>j。根据这个规则，huffman表只需要给出码长中码字的个数即可，以及相应代表的符号。下图是一个DC的Huffman表

FFC4：标志Huffman表开始。

001F：表示Huffman的长度。

00：表示这个是DC表的第0个表。

00：表示长度为1的码个数为0.

01：表示长度为2的码个数为1.

05：表示长度为3的码个数为5.

……

生成规则是：同长度的码递增，如果长度变长1，那么将该次的码加1，然后左移一位。例如，长度为3的码有5个，其中第一个是010，那么递增依次是011 100 101 110，这时候长度为3的码结束，要进行长度为4的码，将110+1 = 111右移一位变成1110，这个就是4位码的第一个了。

2）解码过程

利用上述的编码规则，可以得到解码过程的伪代码如下：

逐位读入码流，然后判断是否小于该长度的范式Huffman编码，如果小于则得出编码长度，就可以得到Huffman编码，否则继续读入下一位，然后继续上述判断。

extren KBitInputStream bs;

int len = 1;

int code = bs.ReadBit();

while(code>=first[len])

{

code<<=1;

code& = (bs.ReadBit());//读取下一个bit

len++;

}

len--;//至此，识别出了一个前缀码，下面将code解码为其对应的符号sym

int index = index[len]+(code-first[len]);

int sym = table[index];

first[i]表示长度为i的第一个Huffman编码的整数值

例如在上述的DC表中，first数组取值为{00, 100,1110,11110,1111110,1111110}

假设一个码流为1011101110，解码过程如下：

读入10>first[1],继续读入101>first[2]，继续读入1011<1110，说明该码的长度为3，同时可以求出偏移量101-100=1，查表可以得到表示的符号是4。

这篇关于JPEG—范式哈夫曼编码（Canonical Huffman Code)的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/888529。 23002807@qq.com

相关文章

Java实现字节字符转bcd编码

Java实现字节字符转bcd编码

《Java实现字节字符转bcd编码》BCD是一种将十进制数字编码为二进制的表示方式,常用于数字显示和存储,本文将介绍如何在Java中实现字节字符转BCD码的过程,需要的小伙伴可以了解下... 目录前言BCD码是什么Java实现字节转bcd编码方法补充总结前言BCD码（Binary-Coded Decima

阅读更多...

解决Nginx启动报错Job for nginx.service failed because the control process exited with error code问题

解决Nginx启动报错Job for nginx.service failed because the control process exited with error code问题

《解决Nginx启动报错Jobfornginx.servicefailedbecausethecontrolprocessexitedwitherrorcode问题》Nginx启... 目录一、报错如下二、解决原因三、解决方式总结一、报错如下Job for nginx.service failed bec

阅读更多...

Java 中编码与解码的具体实现方法

Java 中编码与解码的具体实现方法

《Java中编码与解码的具体实现方法》在Java中,字符编码与解码是处理数据的重要组成部分,正确的编码和解码可以确保字符数据在存储、传输、读取时不会出现乱码,本文将详细介绍Java中字符编码与解码的... 目录Java 中编码与解码的实现详解1. 什么是字符编码与解码？1.1 字符编码（Encoding）1

阅读更多...

基于Go语言实现Base62编码的三种方式以及对比分析

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码（含边界处理）二、关键实现细

阅读更多...

解决IDEA报错:编码GBK的不可映射字符问题

解决IDEA报错:编码GBK的不可映射字符问题

《解决IDEA报错:编码GBK的不可映射字符问题》：本文主要介绍解决IDEA报错:编码GBK的不可映射字符问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录IDEA报错:编码GBK的不可映射字符终端软件问题描述原因分析解决方案方法1：将命令改为方法2：右下jav

阅读更多...

Python使用自带的base64库进行base64编码和解码

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

阅读更多...

VSCode中C/C++编码乱码问题的两种解决方法

VSCode中C/C++编码乱码问题的两种解决方法

《VSCode中C/C++编码乱码问题的两种解决方法》在中国地区,Windows系统中的cmd和PowerShell默认编码是GBK,但VSCode默认使用UTF-8编码,这种编码不一致会导致在VSC... 目录问题方法一：通过 Code Runner 插件调整编码配置步骤方法二：在 PowerShell

阅读更多...

Python如何实现读取csv文件时忽略文件的编码格式

Python如何实现读取csv文件时忽略文件的编码格式

《Python如何实现读取csv文件时忽略文件的编码格式》我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,所以这篇文章为大家介绍了Python如何实现读取csv文件时忽略文件的编码格式... 目录1、背景介绍2、库的安装3、核心代码4、完整代码1、背景介绍我们再日常读取csv文件的时候经常

阅读更多...

C++ | Leetcode C++题解之第393题UTF-8编码验证

C++ | Leetcode C++题解之第393题UTF-8编码验证

题目：题解： class Solution {public:static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num &

阅读更多...

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目：题解： static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

阅读更多...