小张学算法之基础算法:2.游标编码算法

2024-02-20 06:10

本文主要是介绍小张学算法之基础算法:2.游标编码算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

定义:

游标编码就是将一连串相同的字符或数据使用 次数+数据的方式进行压缩。属于熵编码的一种。

例子:
加入文本数据:
aaaaaabbbbbbbccc
就可以表示为
6a7b3c
原本存储需要16个byte存储,现在只需要6个byte了。
如何存储呢:
如果只是顺序的存储cnt+数据的存储方式,我们没法解决有数字的文本信息,当出现数字时没法知道到底是数字4还是cnt值为4。

存储结构

所以我们以这样的数据结构来存储:

struct{byte cnt;byte dat;
}

第一字节存cnt,第二字节存数据,当然这个数据可以是字符也可是一个字节的二进制数据。

适用条件

出现连续的重复序列的数据

例子

我们对一张色域256的图片进行压缩,(色域256色刚好一个像素对应一个字节,如果其他色域,一个像素不是一个字节那就可能没有一系列重复的字节),window 画图工具打开,进行艺术创造~,保存256色域 nihao.bmp
在这里插入图片描述
上代码进行压缩(python实现)

#-*- coding:utf-8 -*-def rle_compile(src_path, dest_path):with open(src_path, 'rb') as src_fd:with open(dest_path, 'wb') as dest_fd:cur_byt = src_fd.read(1)last_byt = Nonecnt = 0;while cur_byt:if cur_byt != last_byt:if last_byt is not None:write_pair(dest_fd, cnt, last_byt)last_byt = cur_bytcnt = 1else:cnt = cnt + 1if cnt > 255:write_pair(dest_fd, 255, last_byt)cnt=1cur_byt = src_fd.read(1)if cnt > 0:write_pair(dest_fd, cnt, last_byt)def write_pair(fd, cnt, dat_byt):fd.write(int.to_bytes(cnt, 1, byteorder='big'))fd.write(dat_byt)def rle_decompile(src_path, dest_path):with open(src_path, 'rb') as src_fd:with open(dest_path, 'wb') as dest_fd:cnt = src_fd.read(1)dat_byt = src_fd.read(1)while cnt and dat_byt:dest_fd.write(int.from_bytes(cnt,byteorder='big')*dat_byt)cnt = src_fd.read(1)dat_byt = src_fd.read(1)
def main():src_path = 'nihao.bmp'com_path = 'nihao_cmo.zfj'decom_path = 'nihao_decmo.bmp'rle_compile(src_path, com_path)rle_decompile(com_path, decom_path)
if __name__ == '__main__':main()

在这里插入图片描述
508KB的源文件压缩到11KB,压缩率达2.1%!!!

这篇关于小张学算法之基础算法:2.游标编码算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/727272

相关文章

springboot+dubbo实现时间轮算法

《springboot+dubbo实现时间轮算法》时间轮是一种高效利用线程资源进行批量化调度的算法,本文主要介绍了springboot+dubbo实现时间轮算法,文中通过示例代码介绍的非常详细,对大家... 目录前言一、参数说明二、具体实现1、HashedwheelTimer2、createWheel3、n

Python基础文件操作方法超详细讲解(详解版)

《Python基础文件操作方法超详细讲解(详解版)》文件就是操作系统为用户或应用程序提供的一个读写硬盘的虚拟单位,文件的核心操作就是读和写,:本文主要介绍Python基础文件操作方法超详细讲解的相... 目录一、文件操作1. 文件打开与关闭1.1 打开文件1.2 关闭文件2. 访问模式及说明二、文件读写1.

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

SpringBoot实现MD5加盐算法的示例代码

《SpringBoot实现MD5加盐算法的示例代码》加盐算法是一种用于增强密码安全性的技术,本文主要介绍了SpringBoot实现MD5加盐算法的示例代码,文中通过示例代码介绍的非常详细,对大家的学习... 目录一、什么是加盐算法二、如何实现加盐算法2.1 加盐算法代码实现2.2 注册页面中进行密码加盐2.

C#基础之委托详解(Delegate)

《C#基础之委托详解(Delegate)》:本文主要介绍C#基础之委托(Delegate),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1. 委托定义2. 委托实例化3. 多播委托(Multicast Delegates)4. 委托的用途事件处理回调函数LINQ

Java时间轮调度算法的代码实现

《Java时间轮调度算法的代码实现》时间轮是一种高效的定时调度算法,主要用于管理延时任务或周期性任务,它通过一个环形数组(时间轮)和指针来实现,将大量定时任务分摊到固定的时间槽中,极大地降低了时间复杂... 目录1、简述2、时间轮的原理3. 时间轮的实现步骤3.1 定义时间槽3.2 定义时间轮3.3 使用时

VSCode中C/C++编码乱码问题的两种解决方法

《VSCode中C/C++编码乱码问题的两种解决方法》在中国地区,Windows系统中的cmd和PowerShell默认编码是GBK,但VSCode默认使用UTF-8编码,这种编码不一致会导致在VSC... 目录问题方法一:通过 Code Runner 插件调整编码配置步骤方法二:在 PowerShell

如何通过Golang的container/list实现LRU缓存算法

《如何通过Golang的container/list实现LRU缓存算法》文章介绍了Go语言中container/list包实现的双向链表,并探讨了如何使用链表实现LRU缓存,LRU缓存通过维护一个双向... 目录力扣:146. LRU 缓存主要结构 List 和 Element常用方法1. 初始化链表2.

Python如何实现读取csv文件时忽略文件的编码格式

《Python如何实现读取csv文件时忽略文件的编码格式》我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,所以这篇文章为大家介绍了Python如何实现读取csv文件时忽略文件的编码格式... 目录1、背景介绍2、库的安装3、核心代码4、完整代码1、背景介绍我们再日常读取csv文件的时候经常

golang字符串匹配算法解读

《golang字符串匹配算法解读》文章介绍了字符串匹配算法的原理,特别是Knuth-Morris-Pratt(KMP)算法,该算法通过构建模式串的前缀表来减少匹配时的不必要的字符比较,从而提高效率,在... 目录简介KMP实现代码总结简介字符串匹配算法主要用于在一个较长的文本串中查找一个较短的字符串(称为