文件压缩 之RLE算法和哈弗曼算法

2023-10-07 20:10
文章标签 算法 压缩 弗曼 rle

本文主要是介绍文件压缩 之RLE算法和哈弗曼算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文件压缩

1.什么是文件?

文件是存储在磁盘等媒介中的一种形式,磁盘是以字节为单位存储的,所以文件也是。存储文字的叫文本文件,存储图形的叫图像文件。

2.压缩算法之RLE算法

RLE算法是使用“数据 * 重复次数”来表示数据的一种方法。比如数据AAAAASSRRR,使用RLE算法表示为:A5S2R3,从10个字节压缩到6个字节。

但这种算法只适用于有重复字节出现的文件,比如图像文件,但并不实用与于文本文件。

3.压缩算法之哈弗曼算法

哈弗曼算法是将出现频率高的字符用尽量少的位数来表示。比如一个文本文件中“I”出现100次、“L”出现3次,如果一个字符用一个字节表示则为103 * 8 = 824bit,如果“I”用2bit,“L”用10bit表示,则为100 * 2 + 3 * 10 = 230bit。

哈弗曼算法会为每个要压缩的文件构造最佳的编码体系,再以此为基础进行压缩和解压。压缩后的文件存着哈弗曼编码信息和压缩后的数据。
在这里插入图片描述

注意:压缩后的文件也是以字节为单位存储的
在这里插入图片描述

4.使用哈弗曼树构造编码体系
在这里插入图片描述
可以看到,出现频率最高的字符对应编码位数最短,并且编码不会出现歧义。解压时以位为单位对数据进行排查,与哈弗曼树比较看是否找到相应编码。

5.可逆压缩与不可逆压缩

顾名思义,可逆压缩指解压后与压缩前一模一样,比如文本文件必须是可逆压缩。不可逆压缩则相反,比如图像文件只要解压后不影响使用就没必要一模一样。

6.说明

本文是《程序是怎样跑起来的》读书笔记,压缩算法有很多种,这里只介绍了其中两种,由于各文件压缩需求不同,至今学界也不能提出一种万能压缩算法。所以我们也有机会原创自己的压缩算法,压缩算法的拙劣需要花费功夫。

如发现什么错误,请兄弟们指正,大家一起进步!

这篇关于文件压缩 之RLE算法和哈弗曼算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/160142

相关文章

Java图片压缩三种高效压缩方案详细解析

《Java图片压缩三种高效压缩方案详细解析》图片压缩通常涉及减少图片的尺寸缩放、调整图片的质量(针对JPEG、PNG等)、使用特定的算法来减少图片的数据量等,:本文主要介绍Java图片压缩三种高效... 目录一、基于OpenCV的智能尺寸压缩技术亮点:适用场景:二、JPEG质量参数压缩关键技术:压缩效果对比

springboot+dubbo实现时间轮算法

《springboot+dubbo实现时间轮算法》时间轮是一种高效利用线程资源进行批量化调度的算法,本文主要介绍了springboot+dubbo实现时间轮算法,文中通过示例代码介绍的非常详细,对大家... 目录前言一、参数说明二、具体实现1、HashedwheelTimer2、createWheel3、n

SpringBoot3实现Gzip压缩优化的技术指南

《SpringBoot3实现Gzip压缩优化的技术指南》随着Web应用的用户量和数据量增加,网络带宽和页面加载速度逐渐成为瓶颈,为了减少数据传输量,提高用户体验,我们可以使用Gzip压缩HTTP响应,... 目录1、简述2、配置2.1 添加依赖2.2 配置 Gzip 压缩3、服务端应用4、前端应用4.1 N

一文详解SpringBoot响应压缩功能的配置与优化

《一文详解SpringBoot响应压缩功能的配置与优化》SpringBoot的响应压缩功能基于智能协商机制,需同时满足很多条件,本文主要为大家详细介绍了SpringBoot响应压缩功能的配置与优化,需... 目录一、核心工作机制1.1 自动协商触发条件1.2 压缩处理流程二、配置方案详解2.1 基础YAML

SpringBoot实现MD5加盐算法的示例代码

《SpringBoot实现MD5加盐算法的示例代码》加盐算法是一种用于增强密码安全性的技术,本文主要介绍了SpringBoot实现MD5加盐算法的示例代码,文中通过示例代码介绍的非常详细,对大家的学习... 目录一、什么是加盐算法二、如何实现加盐算法2.1 加盐算法代码实现2.2 注册页面中进行密码加盐2.

Java时间轮调度算法的代码实现

《Java时间轮调度算法的代码实现》时间轮是一种高效的定时调度算法,主要用于管理延时任务或周期性任务,它通过一个环形数组(时间轮)和指针来实现,将大量定时任务分摊到固定的时间槽中,极大地降低了时间复杂... 目录1、简述2、时间轮的原理3. 时间轮的实现步骤3.1 定义时间槽3.2 定义时间轮3.3 使用时

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

如何通过Golang的container/list实现LRU缓存算法

《如何通过Golang的container/list实现LRU缓存算法》文章介绍了Go语言中container/list包实现的双向链表,并探讨了如何使用链表实现LRU缓存,LRU缓存通过维护一个双向... 目录力扣:146. LRU 缓存主要结构 List 和 Element常用方法1. 初始化链表2.

golang字符串匹配算法解读

《golang字符串匹配算法解读》文章介绍了字符串匹配算法的原理,特别是Knuth-Morris-Pratt(KMP)算法,该算法通过构建模式串的前缀表来减少匹配时的不必要的字符比较,从而提高效率,在... 目录简介KMP实现代码总结简介字符串匹配算法主要用于在一个较长的文本串中查找一个较短的字符串(称为

通俗易懂的Java常见限流算法具体实现

《通俗易懂的Java常见限流算法具体实现》:本文主要介绍Java常见限流算法具体实现的相关资料,包括漏桶算法、令牌桶算法、Nginx限流和Redis+Lua限流的实现原理和具体步骤,并比较了它们的... 目录一、漏桶算法1.漏桶算法的思想和原理2.具体实现二、令牌桶算法1.令牌桶算法流程:2.具体实现2.1