机智零崎不会没梗Ⅱ (哈夫曼编码、优先队列)

2023-10-30 01:30

本文主要是介绍机智零崎不会没梗Ⅱ (哈夫曼编码、优先队列),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

题目描述

你满心欢喜的召唤出了外星生物,以为可以变身超人拥有强大力量战胜一切怪兽,然而面对着身前高大的外星生物你一脸茫然,因为,你懂M78星云语吗?不过不用担心,因为零崎非常机智,他给出了关键性的提示:“讲道理,日语可是全宇宙通用语,所以为什么不试试和外星人讲日语呢?”

不过现在外星生物说的话都是“!@#$%^&%#%I&!……”这样的东西,你要怎么转换成日语呢?

作位全宇宙通用的日语,自然有一套万能的转换算法,那就是Huffman编码转换!当然了这肯定不是普通的Huffman编码转换,而是根据不同的编码长度转换为不同的假名。

输入

第一行为一个整数t,接下来t行数据。1<=t<=100

每组输入数据为一个外星语字符串,为了表示方便,暂时使用大小写英文字母代替外星字母。字符串长度不超过2000

输出

对于每组数据,输出对应的二进制Huffman编码总长度

输入样例

2
abababac
abcdefg

输出样例

12
20
题目来源:http://biancheng.love/contest/23/problem/D/index
解题思路:在前面的哈夫曼树构造以及哈夫曼编码和解码时,已经讲述了哈夫曼编码的方式。现在我们需要得到哈夫曼编码的长度。回忆一下在解码过程中的算法,如果是0向左搜索,如果是1向右搜索。因此一个字符在一个构造好的哈夫曼树中都是居于叶子结点。意思就是树的各个分叉的最低端。因此每个字符的长度也就是该字符在哈夫曼树中的深度。希望能够理解这一点。
在明白字符长度就是字符深度之后开始重新分析一下哈夫曼的树的构造过程。哈夫曼树的建立时通过对每个字符出现频率的统计来设计的,不同的出现频率会对应不同的深度也就是不同的长度。
建立过程如下:
1、取出频率最小的两个数,将这两个数按照最优二叉树的规则(左孩子<父节点<右孩子)得到父节点的值,将这个值放到上述频率中(相当于合并了两个最小的两个频率)
2、按照上述规则进行反复合并与放回。
3、得到哈夫曼树。
通过上述分析得到每次需要得到两个最小的频率。怎样才能实现每次得到最小的两个频率呢?可以通过数组,但是每次都要排序,很麻烦也很费时间;可以使用第i个顺序统计量的随机算法,但是其复杂度也是很高的。那我们可以选用什么结构呢?这时候就到了之前讲过的
优先队列
使用优先队列的过程:
1、首先需要统计字符串中每个字母的出现频率,由于题目中已经简化问题,将字符限制在小写字符a到小写字符z,
2、初始化a到z的出现频率为0,所以在统计完频率频率之后需要借助频率不为0这一重要条件将出现的字符push进入队列。
3、每次取出最小的两个相加之后再放入优先队列。退出循环的条件为优先队列为空。
下面给出本题代码:
#include <bits/stdc++.h>
#define max_size 10010using namespace std;typedef long long LL;
char c[max_size];
long long f[max_size];priority_queue<LL ,vector<LL>,greater<LL> >q;//建立小顶堆;
long long n,ans;
int main()
{int n;scanf("%d",&n);while(n--){string s;cin>>s;getchar();memset(f,0,sizeof(f));int lens=s.size();for(int i=1; i<=lens; i++){c[i]=s[i-1];f[c[i]]++;}while(!q.empty())q.pop();for(int i=65; i<=122; i++){if(f[char(i)]>0){sum++;q.push(f[char(i)]);}}ans=0;while(q.size()>1){LL a=q.top();q.pop();LL b=q.top();q.pop();ans+=(a+b); // 因为编码长度和其在树中的层数相关q.push(a+b);}printf("%lld\n",ans);}return 0;
}
 

可以发现在前面的统计频率不仅仅是为了统计频率,同时也是实现了将其push进优先队列。

下面给出按照哈夫曼树解决问题的代码,可以比较两种方法的优缺点:
  1 #include <iostream>
  2 #include <cstdio>
  3 #include <cmath>
  4 #include <cstdlib>
  5 #include <algorithm>
  6 #include <iomanip>
  7 #include <cstring>
  8 #include <string>
  9 #define INF 0xFFFFFF
 10 using namespace std;
 11 
 12 typedef struct
 13 {
 14     int parent[1005];
 15     int lchild[1005];
 16     int rchild[1005];
 17     int weight[1005];
 18 } Htree;
 19 
 20 int createHt(Htree &ht)
 21 {
 22     int n = 0;//length;
 23     int min1,min2;
 24     int lchild,rchild;
 25     memset(ht.parent,-1,sizeof(ht.parent));
 26     memset(ht.lchild,-1,sizeof(ht.lchild));
 27     memset(ht.rchild,-1,sizeof(ht.rchild));
 28     memset(ht.weight,0,sizeof(ht.weight));
 29 
 30     string str;
 31     cin>>str;
 32     int uppercase[26], lowercase[26];
 33     memset(uppercase, 0,sizeof(uppercase));
 34     memset(lowercase, 0, sizeof(lowercase));
 35     for(int i = 0; i<str.length(); i++)
 36     {
 37         if(str[i]<91)//uppercase
 38             uppercase[str[i]-65]++;
 39         else
 40             lowercase[str[i]-97]++;
 41     }
 42     for(int i=0; i<26; i++)
 43     {
 44         if(uppercase[i]!=0)
 45         ht.weight[n++] = uppercase[i];
 46     }
 47     for(int i=0; i<26; i++)
 48     {
 49         if(lowercase[i]!=0)
 50         ht.weight[n++] = lowercase[i];
 51     }
 52 
 53     for(int i=n; i<2*n-1; i++)
 54     {
 55         min1=min2=INF;
 56         lchild=rchild=-1;
 57         for(int j=0; j<i; j++)
 58         {
 59             if(ht.parent[j]==-1)
 60             {
 61                 if(ht.weight[j]<min1)
 62                 {
 63                     min2=min1;
 64                     rchild=lchild;
 65                     min1=ht.weight[j];
 66                     lchild=j;
 67                 }
 68                 else if(ht.weight[j]<min2)
 69                 {
 70                     min2=ht.weight[j];
 71                     rchild=j;
 72                 }
 73             }
 74         }
 75         ht.weight[i]=ht.weight[lchild]+ht.weight[rchild];
 76         ht.lchild[i]=lchild;
 77         ht.rchild[i]=rchild;
 78         ht.parent[lchild]=ht.parent[rchild]=i;
 79     }
 80     return n;
 81 }
 82 
 83 int main()
 84 {
 85     int T;
 86     Htree ht;
 87     long long result;
 88     int level;
 89     cin>>T;
 90     while(T--)
 91     {
 92         int len = createHt(ht);
 93         result = 0;
 94         for(int i = 0; i<len; i++)
 95         {
 96             level = 0;
 97             int j = i;
 98             while(ht.parent[j]!=-1)
 99             {
100                 level++;
101                 j=ht.parent[j];
102             }
103             result+=level*ht.weight[i];
104         }
105         printf("%lld\n", result);
106     }
107 }
View Code
 

 



转载于:https://www.cnblogs.com/zpfbuaa/p/5002055.html

这篇关于机智零崎不会没梗Ⅱ (哈夫曼编码、优先队列)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/304701

相关文章

hdu1180(广搜+优先队列)

此题要求最少到达目标点T的最短时间,所以我选择了广度优先搜索,并且要用到优先队列。 另外此题注意点较多,比如说可以在某个点停留,我wa了好多两次,就是因为忽略了这一点,然后参考了大神的思想,然后经过反复修改才AC的 这是我的代码 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<

poj 3190 优先队列+贪心

题意: 有n头牛,分别给他们挤奶的时间。 然后每头牛挤奶的时候都要在一个stall里面,并且每个stall每次只能占用一头牛。 问最少需要多少个stall,并输出每头牛所在的stall。 e.g 样例: INPUT: 51 102 43 65 84 7 OUTPUT: 412324 HINT: Explanation of the s

poj 2431 poj 3253 优先队列的运用

poj 2431: 题意: 一条路起点为0, 终点为l。 卡车初始时在0点,并且有p升油,假设油箱无限大。 给n个加油站,每个加油站距离终点 l 距离为 x[i],可以加的油量为fuel[i]。 问最少加几次油可以到达终点,若不能到达,输出-1。 解析: 《挑战程序设计竞赛》: “在卡车开往终点的途中,只有在加油站才可以加油。但是,如果认为“在到达加油站i时,就获得了一

poj3750约瑟夫环,循环队列

Description 有N个小孩围成一圈,给他们从1开始依次编号,现指定从第W个开始报数,报到第S个时,该小孩出列,然后从下一个小孩开始报数,仍是报到S个出列,如此重复下去,直到所有的小孩都出列(总人数不足S个时将循环报数),求小孩出列的顺序。 Input 第一行输入小孩的人数N(N<=64) 接下来每行输入一个小孩的名字(人名不超过15个字符) 最后一行输入W,S (W < N),用

C++ | Leetcode C++题解之第393题UTF-8编码验证

题目: 题解: class Solution {public:static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num &

POJ2010 贪心优先队列

c头牛,需要选n头(奇数);学校总共有f的资金, 每头牛分数score和学费cost,问合法招生方案中,中间分数(即排名第(n+1)/2)最高的是多少。 n头牛按照先score后cost从小到大排序; 枚举中间score的牛,  预处理左边与右边的最小花费和。 预处理直接优先队列贪心 public class Main {public static voi

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

form表单提交编码的问题

浏览器在form提交后,会生成一个HTTP的头部信息"content-type",标准规定其形式为Content-type: application/x-www-form-urlencoded; charset=UTF-8        那么我们如果需要修改编码,不使用默认的,那么可以如下这样操作修改编码,来满足需求: hmtl代码:   <meta http-equiv="Conte

Java并发编程之——BlockingQueue(队列)

一、什么是BlockingQueue BlockingQueue即阻塞队列,从阻塞这个词可以看出,在某些情况下对阻塞队列的访问可能会造成阻塞。被阻塞的情况主要有如下两种: 1. 当队列满了的时候进行入队列操作2. 当队列空了的时候进行出队列操作123 因此,当一个线程试图对一个已经满了的队列进行入队列操作时,它将会被阻塞,除非有另一个线程做了出队列操作;同样,当一个线程试图对一个空

深度优先(DFS)和广度优先(BFS)——算法

深度优先 深度优先搜索算法(英语:Depth-First-Search,DFS)是一种用于遍历或搜索树或图的算法。 沿着树的深度遍历树的节点,尽可能深的搜索树的分支,当节点v的所在边都己被探寻过,搜索将回溯到发现节点v的那条边的起始节点。这一过程一直进行到已发现从源节点可达的所有节点为止。如果还存在未被发现的节点,则选择其中一个作为源节点并重复以上过程,整个进程反复进行直到所有节点都被访