图像压缩(1)RGB888与RGB565图像

2023-10-24 04:12

本文主要是介绍图像压缩(1)RGB888与RGB565图像,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

图像压缩(1)RGB888与RGB565图像

  • 前言
  • 一. 图像数据格式
    • 1.1 不同RGB格式
      • (1)RGB16
      • (2)RGB24
      • (3)RGB32
      • (4)ARGB32
    • 1.2 RGB565与RGB888对比
      • (1)区别
      • (2)各自优缺点
  • 二. 图像格式转换
    • 2.1 取位与补位
    • 2.2 其他转换方法
  • 三. 图像压缩
    • 3.1 G6压缩法(16位真彩色数据压缩算法)
    • 3.2 基于FPGA片上ROM的RGB565屏幕图像显示
  • 四. RGB888和RGB565颜色对照表

前言

   最近在接触图像压缩相关项目,之前对图像压缩接触的较少,对检测分类识别相关的图像信号处理接触学习的相对比较多一些,所以也需要学习学习,搜集整理了一些资料,在这里简单做个笔记,也分享出来和大家交流学习。

一. 图像数据格式

   RGB色彩模式是工业界的一种颜色标准,是通过对红、绿、蓝三原色进行组合得到各种各样不同颜色的表示,这在初中物理就有的,RGB三个通道颜色的组合,几乎囊括了人类视力所能感知的所有颜色,因此成为目前运用最广的颜色系统之一。一般而言,我们所感知的现实视觉与各类硬件平台的图像视觉是有很大差距的,不同现实设备因其设备资源限制与具体应用需求,并不需要高精度的显示需求,在满足清晰可见的基础上,可能对传输或存储的要求更严苛。由此产生各种类型的RGB格式:如RGB16、RGB24、RGB32、ARGB32等等。

1.1 不同RGB格式

(1)RGB16

RGB16数据格式主要有二种:RGB565(或者是R5G6B5)和RGB555(或者是R5G5B5)。
RGB565:每个像素用16比特位表示,占2个字节,RGB分量分别使用5位、6位、5位。
RGB555:每个像素用16比特位表示,占2个字节,RGB分量都使用5位(最高位空闲)。

(2)RGB24

一般RGB24即指RGB888(或者是R8G8B8)
RGB888:每个像素用24比特位表示,占3个字节,注意:在内存中RGB各分量的排列顺序为:BGR BGR BGR 

(3)RGB32

RGB32:图像每个像素用32比特位表示,占4个字节,R,G,B分量分别用8个bit表示,存储顺序为B,G,R,最后8个字节保留。注意:在内存中RGB各分量的排列顺序为:BGRA BGRA BGRA 。

(4)ARGB32

就是带alpha通道的RGB24,与RGB32的区别在于,保留的8个bit用来表示透明,也就是alpha的值
ARGB8888:每个像素用24比特位表示,占3个字节,注意:在内存中ARGB各分量的排列顺序为:BGRA BGRA BGRA 

1.2 RGB565与RGB888对比

(1)区别

正常的RGB24是由24位即3个字节来描述一个像素,R、G、B各8位。而实际使用中为了减少图像数据的尺寸,如视频领域,对R、G、B所使用的位数进行的缩减,如RGB565和RGB555。

RGB565 就是R-5bit,G-6bit,B-5bit
RGB555 就是R-5bit,G-5bit,B-5bit
RGB888 就是R-8bit,G-8bit,B-8bit ;其实这就是RGB24

RGB565,16bit
RGB888,24bit

另外常见的BMP图像文件,即是在RGB的像素数据基础上增加位图头数据而成的图像文件格式。

一般BMP是BGR888,jpeg是YUV的,其他的要看各自格式的标准描述。

(2)各自优缺点

从屏幕自身说,屏幕自身的控制器必须要达到RGB888的标准,才可以使用RGB888,相比RGB565,需要屏幕主控的存储空间增加1/2。RGB888的颜色分辨率肯定要比565高,造价成本更高。RGB565一方面可以降低成本,同时,减少单片机传输的数据量,能够实现2^16种颜色,满足一般的使用场景;主要缺点,就是色域没有RGB888广。

二. 图像格式转换

在这里学习一下RGB888与RGB565的转换,即24位色彩与16位色彩的转换:

2.1 取位与补位

24位RGB[23:0]转16位RGB[15:0]是通过取高位来实现的。取RGB[23:19],RGB[15:10],RGB[7:3]作为RGB三原色的值。
16位RGB[23:0]转24位RGB[15:0]是通过补位来实现的。使用位拼接的语法为RGB低位补0至8位即可。

2.2 其他转换方法

R8 = ( R5 * 527 + 23 ) >> 6;
G8 = ( G6 * 259 + 33 ) >> 6;
B8 = ( B5 * 527 + 23 ) >> 6;R5 = ( R8 * 249 + 1014 ) >> 11;
G6 = ( G8 * 253 +  505 ) >> 10;
B5 = ( B8 * 249 + 1014 ) >> 11;
Apple ( iOS Accelerate Framework ):
Pixel8 red = (5bitRedChannel * 255 + 15) / 31 
Pixel8 green = (6bitGreenChannel * 255 + 31) / 63 
Pixel8 blue = (5bitBlueChannel * 255 + 15) / 31

三. 图像压缩

3.1 G6压缩法(16位真彩色数据压缩算法)

此方法并非是我们常见的PNG,JPG的压缩算,此方法只是应用于单片机刷新RGB565图片,压缩和解压过程不需要很大的运算量,对单片机比较友好。但是压缩率也比较低;可以知道图像数据存在多处的相等,这是因为图片的颜色基本没变。很多图像都是有这样的特征:存在颜色的连续。那么我们可以利用颜色的连续特征来压缩数据的存储空间,如果颜色相同,我们就只保留一个数据,这样就节省了2Byte的存储空间。

G6位用来存储一个标志,这个标志的含义:如果相邻两个像素点相等,这个标志位被置1,否则置0。这样我们不需要开辟数据去存储标志了。算法分析:比如第一个点的数据是2,第二个点的数据也是2,那么算法就把第一个点的G6位置1,同时直接隐藏第二个数据。接着我们看第三个数据,虽然第三个数据和第二个数据相同,但是此处不能再隐藏了,因为上个数据就进行了隐藏。第三个数据保留,第四个数据就进行了隐藏。第五个数据保留,因为第六个数据和第五个数据不同,所以第五个数据的G6位置0,后续同理。

压缩前的数据为2,2,2,2,2,3,4,2

压缩后的数据为2(G6=1),2(G6=1),2,3,4,2

解压时,第一个数据为2,我们先判断G6位,这里被置1了,所以这个数据2出现2次,然后下一个2是同样的道理。第三个2,因为G6位没有置1,所以只有1个。

压缩率计算:假设一个图片宽度W,高度H,数据格式RGB565,那么存储这个图片需要的空间为W×H×2 Byte。

如果采用上述压缩算法进行压缩,那么最大的压缩情况是,1,2相等,3,4相等,等等等。此时压缩后的数据量为W×H Byte。如果全图无重复的地方,那就没有压缩,不会出现负压缩的情况。所以此方法的压缩率为50%< G6压缩法 <100% (边界情况暂不考虑是否相等)。总结:此方法是将RGB565的 G6位用来存储标志,进行相邻数据相等压缩,实际的编程中,还会在压缩数据的头位置加上压缩后的数据长度,压缩前的数据长度,压缩前的图片规格等信息。

void YS1_G6(unsigned char PIC[])
{int i;//循环变量int PIC_Addr;//运行到输入图像的位置,不可到达//PIC_SAVE[0]=;长度高位//PIC_SAVE[1]=;长度低位//第一步,遍历原来的数据PIC_SAVE[2]=PIC[0];//第一个数据PIC_SAVE[3]=PIC[1];//第二个数据//PIC_SAVE[3]&=~0X20;//PIC_SAVE[4]=;//存储循环长度PIC_Addr=4;//不可到达位置,长度i=0;while(i<16383)//两个一组进行分组,循环16382次{i++;//后边和前边一样,将第六位置1if((PIC_SAVE[PIC_Addr-2]==PIC[i*2])&&(PIC_SAVE[PIC_Addr-1]==PIC[i*2+1])){PIC_SAVE[PIC_Addr-1]|=0X20;i++;}else//写入当前数据,并将第六位置零{PIC_SAVE[PIC_Addr-1]&=~0X20;}if(i<16384)//防止存储非法数据{//每次处理后必定写入一个数据PIC_SAVE[PIC_Addr]=PIC[i*2];//第一个数据PIC_SAVE[PIC_Addr+1]=PIC[i*2+1];//第二个数据//PIC_SAVE[PIC_Addr+1]&=~0X10;PIC_Addr+=2;//到达下个存储长度位置}//i++;//每次循环后必定处理数据,i向后移动}PIC_SAVE[0]=PIC_Addr/256;//长度高位PIC_SAVE[1]=PIC_Addr%256;//长度低位printf("压缩后的长度为%d",PIC_Addr);
} 

算法说明:压缩后的数据前两位保存的是压缩后的数据长度,这个很重要,是解压时循环次数的依据。还有算法中的循环次数和边界问题,暂时不展开分析。此算法不是通用算法,后续会加入图片的长度计算(输入数据包含数据信息),同时生成的压缩后数据也会存在数据头,这样的算法会比较通用,不至于出现因为压缩对象的更改,而需要手动修改数据。 这里只简单分析一下流程。

第一步:首先我们需要查询并创建一个C文件(txt文件也可以用)。

第二步:然后我们处理一下输入的数据,清除G6位。

第三步:进行压缩,然后计算出压缩后的长度。

第四步:将压缩后的数据保存,然后传输,即可完成压缩编码部分。

G6压缩方法确实有压缩效果,但是效果并不是那么明显,没有达到最好的效果,这是因为图像数据不可能完全相邻相等。获得压缩后的数据时,就可以进行“G6压缩法”的解压。

解压的过程,是压缩的逆过程,此压缩算法的解压是要比压缩过程简单,计算比较少。

解压的算法:最多是计算一下压缩后的数据长度,然后一直循环解压,这里我们先送给屏幕一个数据,如果G6位为1,我们再刷新一次,否则就接着向下循环。每次循环都会后移动两位(因为RGB565是2Byte,数组一般是8位) ,使用G6压缩法,压缩和解压都是比较简单的操作,不涉及大量的计算,压缩过程有大量的数据相等判断操作,解压过程是大量的与运算判断操作。算法可以实现数据的压缩,但是压缩率不是很高。

3.2 基于FPGA片上ROM的RGB565屏幕图像显示

为了实现16位彩色图像的显示,需要对图片压缩(片上ROM的限制)。示例采用60*100像素的图片(总计72000bits),即显示的时候需要将图像放大8倍显示(480×800)。同样使用Img2Lcd软件图片转为需要的bmp格式(水平扫描模式、16位真彩色)(或者用PS、截图(保存为bmp格式)、电脑自带画图软件等,都可以完成转换)。之后使用Matlab将bmp文件信息转化为RGB565格式的mif文件,m文件的源码如下。

clear;
clc;
n=6000;%100*60--16bit
myImg = imread('example.bmp');%读取.bmp文件
fid=fopen('example.mif','w');%打开待写入的.mif文件
fprintf(fid,'WIDTH=16;\n');%写入存储位宽16fprintf(fid,'DEPTH=6000;\n');%写入存储深度6000
fprintf(fid,'ADDRESS_RADIX=UNS;\n');%写入地址类型为无符号整型
fprintf(fid,'DATA_RADIX=HEX;');%写入数据类型为16进制
fprintf(fid,'CONTENT BEGIN\n');%起始内容
image(myImg);
for i=0:n-1         %RGB888 -> RGB565x = mod(i,100)+1;y = fix(i/100)+1;r = uint16(myImg(y,x,1)/8);g = uint16(myImg(y,x,2)/4);b = uint16(myImg(y,x,3)/8);%由于输出的图像为uint8,所以等式左边的变量无法赋值为其他类型r = dec2bin(r);g = dec2bin(g);b = dec2bin(b);%十进制转二进制r = num2str(r);g = num2str(g);b = num2str(b);%数字转字符串if length(r)==1 %根据字符串长度补零--rr = strcat('0000',r);elseif length(r)==2r = strcat('000',r);elseif length(r)==3r = strcat('00',r);elseif length(r)==4r = strcat('0',r); elser = r;endif length(g)==1 %根据字符串长度补零--gg = strcat('00000',g);elseif length(g)==2g = strcat('0000',g);elseif length(g)==3g = strcat('000',g);elseif length(g)==4g = strcat('00',g); elseif length(g)==5g = strcat('0',g);elseg = g;end    if length(b)==1 %根据字符串长度补零--bb = strcat('0000',b);elseif length(b)==2b = strcat('000',b);elseif length(b)==3b = strcat('00',b);elseif length(b)==4b = strcat('0',b); elseb = b;end    k = strcat(r,g,b);%k = str2num(k);k = bin2dec(k);fprintf(fid,'\t%d:%x;\n',i,k);%disp(k);
end
fprintf(fid,'END;\n');
fclose(fid);%关闭文件

查阅Matlab中文手册得知,软件读取8位的bmp图像时转化为单个矩阵。而读取16位bmp图像时,将其转化为3个8位矩阵,所以提取图像数据转为RGB565时需要除以特定的数。因为Matlab会把数据自动转化为uint8类型,所以需要将数据强制类型转换为二进制。在数据的高位补零后,再用字符串连接函数,将其连接为16位的字符串。最后用二进制转十进制函数,把字符串直接转为数字,存与指定的mif文件中。定制好ROM为16位,6000深度,例化下载后,其显示结果如下(其实,由于matlab读取16位bmp图像时,将其转化为3个8位矩阵。故可不需要用软件转换为16位的bmp文件再用matlab提取数据)。显示的Verilog主要程序如下:

/*color_rom--彩色-16位*/        localparamBMP_W            =    11'd100,   //显示区域宽度 = 图片宽BMP_H            =    11'd60;   //显示区域高度 = 图片高wire [12:0]  pic_addr;    wire [15:0] q;assign pic_addr = hcount[10:3] + vcount[10:3]*BMP_W;color16_rom color16_rom(.address(pic_addr),.clock(clk),.q(q));assign disp_data = q;
/*color_rom-end*/

在计算机中,图像以RGB888显示,24位图每个像素保存了32bit的数据,即RGB888+Alpha,但是对于真彩色图像而言,肉眼在16bit的时候已经难以分辨了,因此,有些时候,可以将RGB888转换为RGB565来存储,减少存储器容量的同时,降低了数据量;在后端显示时,再次把RGB565转换为RGB888,就实现数据宽度的匹配!

RGB888->RGB565->RGB888

但是,RGB888->RGB565时,自然只要提取高位即可,但会导致低位的缺失;同时,但当RGB565->RGB888时,势必导致低位的缺失。为了数据的饱和以及色彩的减小,提出了一种新的思维,新的算法:量化补偿

(1)RGB888-RGB565

24bit RGB888 -> 16bit RGB565 的转换
24ibt RGB888 {R7 R6 R5 R4 R3 R2 R1 R0} {G7 G6 G5 G4 G3 G2 G1 G0} {B7 B6 B5 B4 B3 B2 B1 B0}
16bit RGB565 {R7 R6 R5 R4 R3} {G7 G6 G5 G4 G3 G2} {B7 B6 B5 B4 B3}
可以修正,比如(当然人眼无法感觉,但是RG888-RGB565-RGB888的时候更好补偿)
R:197=>197>>3=24
R:197=192+5=>24+0.625≈25
所以
R5=R[2] ? R[7:3]+1 : R[7:3];
G5=G[1] ? G[7:2]+1 : G[7:2];
B5=B[2] ? B[7:3]+1 : B[7:3];

(2)RGB565-RGB888
16bit RGB565 -> 24bit RGB888 的转换
16bit RGB656 {R4 R3 R2 R1 R0} {G5 G4 G3 G2 G1 G0} {B4 B3 B2 B1 B0}
24ibt RGB888 {R4 R3 R2 R1 R0 0 0 0} {G5 G4 G3 G2 G1 G0 0 0} {B4 B3 B2 B1 B0 0 0 0}
24ibt RGB888 {R4 R3 R2 R1 R0 R2 R1 R0} {G5 G4 G3 G2 G1 G0 G1 G0} {B4 B3 B2 B1 B0 B2 B1 B0}

因此,量化压缩的方法:RGB取高位,并且考虑最低位“四舍五入”,量化补偿的方法:

  1. 将原数据填充至高位
  2. 对于低位,用原始数据的低位进行补偿

四. RGB888和RGB565颜色对照表

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这篇关于图像压缩(1)RGB888与RGB565图像的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/272621

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.

【python计算机视觉编程——8.图像内容分类】

python计算机视觉编程——8.图像内容分类 8.图像内容分类8.1 K邻近分类法(KNN)8.1.1 一个简单的二维示例8.1.2 用稠密SIFT作为图像特征8.1.3 图像分类:手势识别 8.2贝叶斯分类器用PCA降维 8.3 支持向量机8.3.2 再论手势识别 8.4 光学字符识别8.4.2 选取特征8.4.3 多类支持向量机8.4.4 提取单元格并识别字符8.4.5 图像校正

HalconDotNet中的图像特征与提取详解

文章目录 简介一、边缘特征提取二、角点特征提取三、区域特征提取四、纹理特征提取五、形状特征提取 简介   图像特征提取是图像处理中的一个重要步骤,用于从图像中提取有意义的特征,以便进行进一步的分析和处理。HalconDotNet提供了多种图像特征提取方法,每种方法都有其特定的应用场景和优缺点。 一、边缘特征提取   边缘特征提取是图像处理中最基本的特征提取方法之一,通过检

超越IP-Adapter!阿里提出UniPortrait,可通过文本定制生成高保真的单人或多人图像。

阿里提出UniPortrait,能根据用户提供的文本描述,快速生成既忠实于原图又能灵活调整的个性化人像,用户甚至可以通过简单的句子来描述多个不同的人物,而不需要一一指定每个人的位置。这种设计大大简化了用户的操作,提升了个性化生成的效率和效果。 UniPortrait以统一的方式定制单 ID 和多 ID 图像,提供高保真身份保存、广泛的面部可编辑性、自由格式的文本描述,并且无需预先确定的布局。

Winfrom中解决图像、文字模糊的方法

1.添加清单 2.将清单中的下面内容取消注释

使用亚马逊Bedrock的Stable Diffusion XL模型实现文本到图像生成:探索AI的无限创意

引言 什么是Amazon Bedrock? Amazon Bedrock是亚马逊云服务(AWS)推出的一项旗舰服务,旨在推动生成式人工智能(AI)在各行业的广泛应用。它的核心功能是提供由顶尖AI公司(如AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI以及亚马逊自身)开发的多种基础模型(Foundation Models,简称FMs)。

Matplotlib图像读取和输出及jpg、png格式对比,及透明通道alpha设置

图像像素值 图像像素值一般size为3,也就是通道数,分别代表R,G,B,如果只有单一 一个值则表示灰度值,也就是说一张二维图片,当长和宽都为1080时,那么若是灰度图像,图像尺寸为(1080,1080,1)若是RGB图像则为(1080,1080,3), jpg、png图像格式 jpg图像的灰度值范围和RGB范围为[0,255],数值类型为uint8,也就是无符号整数 png图像的灰度值范

如何将卷积神经网络(CNN)应用于医学图像分析:从分类到分割和检测的实用指南

引言 在现代医疗领域,医学图像已经成为疾病诊断和治疗规划的重要工具。医学图像的类型繁多,包括但不限于X射线、CT(计算机断层扫描)、MRI(磁共振成像)和超声图像。这些图像提供了对身体内部结构的详细视图,有助于医生在进行准确诊断和制定个性化治疗方案时获取关键的信息。 1. 医学图像分析的挑战 医学图像分析面临诸多挑战,其中包括: 图像数据的复杂性:医学图像通常具有高维度和复杂的结构