B3870 [GESP202309 四级] 变长编码

2024-06-08 22:36
文章标签 编码 四级 b3870 gesp202309

本文主要是介绍B3870 [GESP202309 四级] 变长编码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

[GESP202309 四级] 变长编码

题目描述

小明刚刚学习了三种整数编码方式:原码、反码、补码,并了解到计算机存储整数通常使用补码。但他总是觉得,生活中很少用到 2 31 − 1 2^{31}-1 2311 这么大的数,生活中常用的 0 ∼ 100 0\sim 100 0100 这种数也同样需要用 4 4 4 个字节的补码表示,太浪费了些。
热爱学习的小明通过搜索,发现了一种正整数的变长编码方式。这种编码方式的规则如下:

1 . 对于给定的正整数,首先将其表达为二进制形式。例如, ( 0 ) { 10 } = ( 0 ) { 2 } (0)_{\{10\}}=(0)_{\{2\}} (0){10}=(0){2} ( 926 ) { 10 } = ( 1110011110 ) { 2 } (926)_{\{10\}}=(1110011110)_{\{2\}} (926){10}=(1110011110){2}

2 . 将二进制数从低位到高位切分成每组 7 7 7 bit,不足 7 7 7bit 的在高位用 0 0 0 填补。例如, ( 0 ) { 2 } (0)_{\{2\}} (0){2} 变为 0000000 0000000 0000000 的一组, ( 1110011110 ) { 2 } (1110011110)_{\{2\}} (1110011110){2} 变为 0011110 0011110 0011110 0000111 0000111 0000111 的两组。

3 . 由代表低位的组开始,为其加入最高位。如果这组是最后一组,则在最高位填上 0 0 0,否则在最高位填上 1 1 1。于是, 0 0 0 的变长编码为 00000000 00000000 00000000 一个字节, 926 926 926 的变长编码为 10011110 10011110 10011110 00000111 00000111 00000111 两个字节。

这种编码方式可以用更少的字节表达比较小的数,也可以用很多的字节表达非常大的数。例如, 987654321012345678 987654321012345678 987654321012345678 的二进制为 ( 0001101 1011010 0110110 1001011 1110100 0100110 1001000 0010110 1001110 ) { 2 } (0001101 \ 1011010 \ 0110110 \ 1001011 \ 1110100 \ 0100110 \ 1001000 \ 0010110 \ 1001110)_{\{2\}} (0001101 1011010 0110110 1001011 1110100 0100110 1001000 0010110 1001110){2},于是它的变长编码为(十六进制表示) CE 96 C8 A6 F4 CB B6 DA 0D,共 9 9 9 个字节。

你能通过编写程序,找到一个正整数的变长编码吗?

输入格式

输入第一行,包含一个正整数 N N N。约定 0 ≤ N ≤ 1 0 18 0\le N \le 10^{18} 0N1018

输出格式

输出一行,输出 N N N 对应的变长编码的每个字节,每个字节均以 2 2 2 位十六进制表示(其中, A-F 使用大写字母表示),两个字节间以空格分隔。

样例 #1

样例输入 #1

0

样例输出 #1

00

样例 #2

样例输入 #2

926

样例输出 #2

9E 07

样例 #3

样例输入 #3

987654321012345678

样例输出 #3

CE 96 C8 A6 F4 CB B6 DA 0D

题目解析

题目描述:
给定一个非负整数N,将其按照变长编码的规则进行编码。变长编码的规则如下:

  1. 对于给定的正整数,首先将其表达为二进制形式。
  2. 将二进制数从低位到高位切分成每组7bit,不足7bit的在高位用0填补。
  3. 由代表低位的组开始,为其加入最高位。如果这组是最后一组,则在最高位填上0,否则在最高位填上1。
  4. 将每一组转换为一个字节,字节的高4位和低4位分别对应十六进制数的一位。
  5. 将所有字节按照从低位组到高位组的顺序输出,字节之间用空格分隔。

解题思路:

  1. 使用vector<uint8_t>存储编码结果的字节。
  2. 对N进行循环处理,直到N为0:
    • 取N的低7位,记为byte。
    • 将N右移7位。
    • 如果N不为0,说明还有更高位的字节,将byte的最高位设为1。
    • 否则,将more标志设为false,表示已经处理完最后一个字节。
    • 将byte添加到结果vector中。
  3. 遍历结果vector,输出每个字节的十六进制表示:
    • 如果不是第一个字节,在前面添加一个空格。
    • 以十六进制格式输出字节,使用大写字母,宽度为2,不足的在前面补0。
  4. 输出换行符。

C++代码实现:

#include <iostream>
#include <vector>
#include <iomanip>
using namespace std;void encodeVarint(uint64_t N) {vector<uint8_t> result;bool more = true;while (more) {uint8_t byte = N & 0x7F; // 取低7位N >>= 7;if (N != 0) {byte |= 0x80; // 不是最后一个字节,最高位填1} else {more = false; // 最后一个字节,最高位填0}result.push_back(byte);}for (size_t i = 0; i < result.size(); ++i) {if (i > 0) {cout << " ";}cout << hex << uppercase << setw(2) << setfill('0') << (int)result[i];}cout << endl;
}int main() {uint64_t N;cin >> N;encodeVarint(N);return 0;
}

代码解释:

  1. encodeVarint函数接受一个无符号64位整数N,表示要编码的非负整数。
  2. 定义resultuint8_t类型的vector,用于存储编码结果的字节。
  3. 定义more为布尔类型,初始值为true,表示是否还有更多字节需要处理。
  4. 进入循环,直到morefalse:
    • N的低7位,记为byte
    • N右移7位。
    • 如果N不为0,说明还有更高位的字节,将byte的最高位设为1。
    • 否则,将more标志设为false,表示已经处理完最后一个字节。
    • byte添加到resultvector中。
  5. 遍历resultvector,输出每个字节的十六进制表示:
    • 如果不是第一个字节,在前面添加一个空格。
    • 使用hexuppercasesetw(2)setfill('0')控制输出格式,以十六进制格式输出字节,使用大写字母,宽度为2,不足的在前面补0。
  6. 输出换行符。
  7. main函数中,读入无符号64位整数N,调用encodeVarint函数对N进行变长编码。

这个解答按照你提供的代码实现了变长编码,使用了C++标准库中的vector、iomanip等功能,并通过位运算和移位操作对整数进行处理。

解析2

#include <iostream>
#include <vector>
#include <iomanip>
#include <sstream>using namespace std;string encodeVarint(uint64_t N) {vector<uint8_t> result;bool more = true;while (more) {uint8_t byte = N & 0x7F; // 取低7位N >>= 7;if (N != 0) {byte |= 0x80; // 不是最后一个字节,最高位填1} else {more = false; // 最后一个字节,最高位填0}result.push_back(byte);}stringstream ss;for (size_t i = 0; i < result.size(); ++i) {if (i > 0) {ss << " ";}ss << hex << uppercase << setw(2) << setfill('0') << (int)result[i];}return ss.str();
}int main() {uint64_t N;cin >> N;string encodedString = encodeVarint(N);cout << encodedString << endl;return 0;
}

解析3

#include <bits/stdc++.h>
using namespace std;long long n;
string a = "0123456789ABCDEF"; // 十六进制的数字void print(int i) { // 输出cout << a[i / 16] << a[i % 16] << " ";
}int main() {cin >> n;if (n == 0) {cout << "00";return 0;}vector<int> result;while (n > 0) {int k = n % 128; // 2^7=128,7位一截n /= 128;if (n > 0) {result.push_back(k + 128); // 判断是否为最高位} else {result.push_back(k);}}reverse(result.begin(), result.end()); // 逆序输出for (int byte : result) {print(byte);}return 0;
}

这篇关于B3870 [GESP202309 四级] 变长编码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1043503

相关文章

Python如何实现读取csv文件时忽略文件的编码格式

《Python如何实现读取csv文件时忽略文件的编码格式》我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,所以这篇文章为大家介绍了Python如何实现读取csv文件时忽略文件的编码格式... 目录1、背景介绍2、库的安装3、核心代码4、完整代码1、背景介绍我们再日常读取csv文件的时候经常

C++ | Leetcode C++题解之第393题UTF-8编码验证

题目: 题解: class Solution {public:static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num &

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

form表单提交编码的问题

浏览器在form提交后,会生成一个HTTP的头部信息"content-type",标准规定其形式为Content-type: application/x-www-form-urlencoded; charset=UTF-8        那么我们如果需要修改编码,不使用默认的,那么可以如下这样操作修改编码,来满足需求: hmtl代码:   <meta http-equiv="Conte

4-4.Andorid Camera 之简化编码模板(获取摄像头 ID、选择最优预览尺寸)

一、Camera 简化思路 在 Camera 的开发中,其实我们通常只关注打开相机、图像预览和关闭相机,其他的步骤我们不应该花费太多的精力 为此,应该提供一个工具类,它有处理相机的一些基本工具方法,包括获取摄像头 ID、选择最优预览尺寸以及打印相机参数信息 二、Camera 工具类 CameraIdResult.java public class CameraIdResult {

Python字符编码及应用

字符集概念 字符集就是一套文字符号及其编码的描述。从第一个计算机字符集ASCII开始,为了处理不同的文字,发明过几百种字符集,例如ASCII、USC、GBK、BIG5等,这些不同的字符集从收录到编码都各不相同。在编程中出现比较严重的问题是字符乱码。 几个概念 位:计算机的最小单位二进制中的一位,用二进制的0,1表示。 字节:八位组成一个字节。(位与字节有对应关系) 字符:我们肉眼可见的文字与符号。

在Eclipse环境下修改Tomcat编码的问题

问题: 由于BMS需要设置UTF-8编码,要不就会出现中文乱码问题; 一、项目保持UTF-8格式; 二、由于可能会多次移除项目、加载项目,不想每次都要修改tmp0\conf 原因: 如果在eclipse中配置了tomcat后,其实,tomcat所用的所有tomcat配置文件,都不是catalina_home/config下面的xml文件,而是在eclipse所创建的Serve

在Unity环境中使用UTF-8编码

为什么要讨论这个问题         为了避免乱码和更好的跨平台         我刚开始开发时是使用VS开发,Unity自身默认使用UTF-8 without BOM格式,但是在Unity中创建一个脚本,使用VS打开,VS自身默认使用GB2312(它应该是对应了你电脑的window版本默认选取了国标编码,或者是因为一些其他的原因)读取脚本,默认是看不到在VS中的编码格式,下面我介绍一种简单快

霍夫曼编码/译码器

赫夫曼树的应用 1、哈夫曼编码   在数据通信中,需要将传送的文字转换成二进制的字符串,用0,1码的不同排列来表示字符。例如,需传送的报文为“AFTER DATA EAR ARE ART AREA”,这里用到的字符集为“A,E,R,T,F,D”,各字母出现的次数为{8,4,5,3,1,1}。现要求为这些字母设计编码。要区别6个字母,最简单的二进制编码方式是等长编码,固定采用3位二进制,可分别用

Base64编码 及 在HTML中用Base编码直接显示图片或嵌入其他文件类型

1.为什么要用到BASE64编码的图片信息      Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一。Base64 主要不是加密,它主要的用途是把一些二进制数转成普通字符用于网络传输。由于一些二进制字符在传输协议中属于控制字符,不能直接传送需要转换一下。最常见的用途是作为电子邮件或WebService附件的传输编码.  2.base64编码定义    目前的internet