JPEG—范式哈夫曼编码(Canonical Huffman Code)

2024-04-09 15:32

本文主要是介绍JPEG—范式哈夫曼编码(Canonical Huffman Code),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  本文来自:https://www.cnblogs.com/k1988/archive/2010/05/18/2165646.html


在大部分介绍JPEG的中文书中都是将全部的JPEG的霍夫曼表给出,可是实际的JPEG文件头并不长,这个使得初看者很迷惑,这么短是如何存储那么长的霍夫曼表。其实,JPEG的霍夫曼表是由一定规则生成,只要给出少量的描述即可生成相应的JPEG的霍夫曼表。

      baselineJPEG系统中采用Canonical Huffman Code(范式哈夫曼编码),而在扩展系统中采用算术编码。

首先介绍一下DC可变长度代码(VLI)编码,AC系数行程长度编码(RLE),首先要采用Zigzeg扫描,形成一维系数。扫描次序如下图所示:

 

1DC系数编码

对差分DC系数用两个符号进行编码。第1个符号表示“长度”,即为DC幅度进行编码需要的位数,符号2表示DC系数的幅度。

例如DC系数为20,那么经过VLI编码变成(5,20)。这个将用于下一步的Huffman编码。

2AC系数编码

类似地,对每个AC系数也采用两个符号进行编码,符号1和符号2.符号1表示了两条信息,分别称为“行程”和“长度”。行程是在之字形矩阵中位于非零Ac系数前的连续零值Ac系数的个数,长度是对Ac系数的幅度进行编码所用的位数。符号2表示了Ac系数的幅度。

例如一个块经过Zigzeg扫描得到AC系数如下: 1 0 -1 0 0 0 0 5 0 10,那么编码如下:(0/11),(1/1-1),(3/35),(1/410),注意符号2表示负数用的是反码,也就是说如果-1,因为1的反码是0,所以-1的符号20另外,如果一个块剩下的所有系数都是0,那么编码到最后一个非零系数,然后用EOB标识符标志块结束。在编码的过程中,如果连续0的个数超过15个,那么用(F/0)即ZRL符号来表示。如果在编码的过程中,形成0xFF的码,那么在0xFF后面添加00.

在编码的过程中,DC的符号1AC的符号1采用的是Huffman编码。

3)范式哈夫曼编码

1)生成规则

范式哈夫曼编码的规则是:长度为i的码字的前j位的数值大于长度为j的码字的数值,其中i>j。根据这个规则,huffman表只需要给出码长中码字的个数即可,以及相应代表的符号。下图是一个DCHuffman

 

 

FFC4:标志Huffman表开始。

001F:表示Huffman的长度。

00:表示这个是DC表的第0个表。

00:表示长度为1的码个数为0.

01:表示长度为2的码个数为1.

05:表示长度为3的码个数为5.

……

生成规则是:同长度的码递增,如果长度变长1,那么将该次的码加1,然后左移一位。例如,长度为3的码有5个,其中第一个是010,那么递增依次是011 100 101 110,这时候长度为3的码结束,要进行长度为4的码,将110+1 = 111右移一位变成1110,这个就是4位码的第一个了。

2)解码过程

利用上述的编码规则,可以得到解码过程的伪代码如下:

逐位读入码流,然后判断是否小于该长度的范式Huffman编码,如果小于则得出编码长度,就可以得到Huffman编码,否则继续读入下一位,然后继续上述判断。

extren KBitInputStream bs;

int len = 1;

int code = bs.ReadBit();

while(code>=first[len])

{

    code<<=1;

    code& = (bs.ReadBit());//读取下一个bit

    len++;

}

len--;//至此,识别出了一个前缀码,下面将code解码为其对应的符号sym

int index = index[len]+(code-first[len]);

int sym = table[index];

 

first[i]表示长度为i的第一个Huffman编码的整数值

例如在上述的DC表中,first数组取值为{00, 100,1110,11110,1111110,1111110}

假设一个码流为1011101110,解码过程如下:

读入10>first[1],继续读入101>first[2],继续读入1011<1110,说明该码的长度为3,同时可以求出偏移量101-100=1,查表可以得到表示的符号是4

这篇关于JPEG—范式哈夫曼编码(Canonical Huffman Code)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/888529

相关文章

C++ | Leetcode C++题解之第393题UTF-8编码验证

题目: 题解: class Solution {public:static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num &

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

form表单提交编码的问题

浏览器在form提交后,会生成一个HTTP的头部信息"content-type",标准规定其形式为Content-type: application/x-www-form-urlencoded; charset=UTF-8        那么我们如果需要修改编码,不使用默认的,那么可以如下这样操作修改编码,来满足需求: hmtl代码:   <meta http-equiv="Conte

研究人员在RSA大会上演示利用恶意JPEG图片入侵企业内网

安全研究人员Marcus Murray在正在旧金山举行的RSA大会上公布了一种利用恶意JPEG图片入侵企业网络内部Windows服务器的新方法。  攻击流程及漏洞分析 最近,安全专家兼渗透测试员Marcus Murray发现了一种利用恶意JPEG图片来攻击Windows服务器的新方法,利用该方法还可以在目标网络中进行特权提升。几天前,在旧金山举行的RSA大会上,该Marcus现场展示了攻击流程,

Debugging Lua Project created in Cocos Code IDE creates “Waiting for debugger to connect” in Win-7

转自 I Installed Cocos Code IDE and created a new Lua Project. When Debugging the Project(F11) the game window pops up and gives me the message waiting for debugger to connect and then freezes. Also a

LLVM入门2:如何基于自己的代码生成IR-LLVM IR code generation实例介绍

概述 本节将通过一个简单的例子来介绍如何生成llvm IR,以Kaleidoscope IR中的例子为例,我们基于LLVM接口构建一个简单的编译器,实现简单的语句解析并转化为LLVM IR,生成对应的LLVM IR部分,代码如下,文件名为toy.cpp,先给出代码,后面会详细介绍每一步分代码: #include "llvm/ADT/APFloat.h"#include "llvm/ADT/S

4-4.Andorid Camera 之简化编码模板(获取摄像头 ID、选择最优预览尺寸)

一、Camera 简化思路 在 Camera 的开发中,其实我们通常只关注打开相机、图像预览和关闭相机,其他的步骤我们不应该花费太多的精力 为此,应该提供一个工具类,它有处理相机的一些基本工具方法,包括获取摄像头 ID、选择最优预览尺寸以及打印相机参数信息 二、Camera 工具类 CameraIdResult.java public class CameraIdResult {

Unstructured cannot write mode RGBA as JPEG 错误解决

Unstructured cannot write mode RGBA as JPEG 错误解决 0. 错误详细1. 解决方法 0. 错误详细 Image Extraction Error: Skipping the failed imageTraceback (most recent call last):File "/root/miniconda3/envs/learn-y

VS Code 调试go程序的相关配置说明

用 VS code 调试Go程序需要在.vscode/launch.json文件中增加如下配置:  // launch.json{// Use IntelliSense to learn about possible attributes.// Hover to view descriptions of existing attributes.// For more information,

Python字符编码及应用

字符集概念 字符集就是一套文字符号及其编码的描述。从第一个计算机字符集ASCII开始,为了处理不同的文字,发明过几百种字符集,例如ASCII、USC、GBK、BIG5等,这些不同的字符集从收录到编码都各不相同。在编程中出现比较严重的问题是字符乱码。 几个概念 位:计算机的最小单位二进制中的一位,用二进制的0,1表示。 字节:八位组成一个字节。(位与字节有对应关系) 字符:我们肉眼可见的文字与符号。