【java数据结构-优先级队列向下调整Topk问题,堆的常用的接口详解】

本文主要是介绍【java数据结构-优先级队列向下调整Topk问题,堆的常用的接口详解】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

🌈个人主页:努力学编程’
个人推荐:基于java提供的ArrayList实现的扑克牌游戏 |C贪吃蛇详解
学好数据结构,刷题刻不容缓:点击一起刷题
🌙心灵鸡汤总有人要赢,为什么不能是我呢
在这里插入图片描述

相信大家对于队列的理解是比较熟悉的,队列是一种先进先出的数据结构,但是我们在日常项目的开发中往往需要对于一些数据的处理是要求所使用的数据结构处理数据时必须有一定的优先级的,比如你在打游戏的时候,字节给你打入职电话,那么手机一定会优先处理电话的业务,或者在你的学生时代,一定经历过老师让学习好的同学先挑座位,类似与这种情况,我们引出一个新的数据结构优先级队列-堆

🌈堆的定义:

堆是一种特殊的树形数据结构,它满足堆属性:对于堆中任意节点 i,父节点的值小于等于(或大于等于)其子节点的值。根据这个属性,可以将堆分为最大堆和最小堆。在最大堆中,父节点的值大于等于其子节点的值;在最小堆中,父节点的值小于等于其子节点的值。

堆通常用于实现优先级队列,因为堆能够快速找到具有最高(或最低)优先级的元素。常见的堆有二叉堆和斐波那契堆,它们在插入和删除操作的时间复杂度上有所不同,但都能保持堆属性

大根堆:

  • 顾名思义:根节点其实是整个完全二叉树的最大值的节点,他的左孩子结点和右孩子节点都比他要小,同时要保证整棵树是大根堆那么每棵子树也必须得是大根堆,这样才可以构成一个完整的大根堆结构。

在这里插入图片描述

小根堆:

  • 有了大根堆理解,我们去学习小根堆就轻松多了,每棵子树的根节点都是这棵子树中的值最小的,这样所有的子树就构成了整个小根堆。
    在这里插入图片描述
  • 有了小根堆和大根堆的概念,我们后面可以尝试自己实现一个小根堆和大根堆,后面会给大家实现。请大家牢记这些基本知识。

🌝堆的创建

  • 讲了堆的一些基本知识,相信大家都和我一样,手痒难耐,非常想自己手搓一个堆,但是在这之前我们必须要先了解一个知识点向下调整,这是我们实现队列的基本要求。

向下调整:

在这里插入图片描述
1. 让parent标记需要调整的节点,child标记parent的左孩子(注意:parent如果有孩子一定先是有左孩子)

2. 如果parent的左孩子存在,即:child < size, 进行以下操作,直到parent的左孩子不存在parent右孩子是否存在,存在找到左右孩子中最小的孩子,让child进行标将parent与较小的孩子child比较,如果

  • parent小于较小的孩子child,调整结束,

  • 否则:交换parent与较小的孩子child,交换完成之后,parent中大的元素向下移动,可能导致子树不满足对的性质,因此需要继续向下调整,即parent = child;child = parent*2+1; 然后继续2。

具体的过程建议大家,在纸上先自己实现一下,这里把整个过程也给大家:
在这里插入图片描述

public void shiftDown(int[]array,int parent){int child=2*parent+1;int size= array.length;while(child<size){if(child+1<size&&array[child+1]<array[child]){child+=1;}if(array[parent]<=array[child]){break;}else{int t=array[parent];array[parent]=array[child];array[child]=t;}parent=child;child=parent*2+1;}}
  • 好了掌握了向下调整的知识点,我们就可以自己手搓一个堆了,我们实现的代码是比较简单的。针对每个节点我们都使用,向下调整的逻辑,就可以实现大根堆或者小根堆,
public static void createHeap(int[] array) {
// 找倒数第一个非叶子节点,从该节点位置开始往前一直到根节点,遇到一个节点,应用向下调整
int root = ((array.length-2)>>1);
for (; root >= 0; root--) {
shiftDown(array, root);
}
public void shiftDown(int[]array,int parent){int child=2*parent+1;int size= array.length;while(child<size){if(child+1<size&&array[child+1]<array[child]){child+=1;}if(array[parent]<=array[child]){break;}else{int t=array[parent];array[parent]=array[child];array[child]=t;}parent=child;child=parent*2+1;}}
}

🚴堆的时间复杂度:

因为初始化堆,是每个数据向下冒泡,每一层冒泡的次数不同,最高层冒泡的次数最多为logn,最底层为1次,设共有h层(h=logn) , 时间复杂度的计算为:1h+2(h-1)+4(h-2)+…+2^(h-1)1

即【节点数所在层数】的累加,如2(h-1)即第二层有两个节点,因为在第二层,所以会冒泡h-1次

可以转化为通项:
k从0到h-1的累加 用错项相减法求 可以得到O(),即O()即O(n)
关于调整堆/删除堆

因为在调整的时候,每调整/删除一次,树的节点就会少一个(跑到有序堆去了),然鹅每次调整的时候,是从下往上冒泡的,所以调整的次数即当前树的层数,那怎么确定当前树的层数呢,直接对当前节点取对数就好了,每一个节点都要进行这样的操作,所以操作的次数是log(n-1)+log(n-2)+…+log2+log1=log(n-1)!=nlogn

故时间复杂度为O(nlogn)

故整个堆排序 时间复杂度取大的O(nlogn)

⛅堆的插入和删除

插入:

大家有没有想过在堆里面如何添加节点呢,整个过程大致分为两个步骤,

  • 将待插入的节点放到二叉树的最后一个叶子节点
  • 从待插入的节点开始依次进行shiftUp向上调整

在这里插入图片描述

具体向上调整代码如何实现,这里也给大家一段代码

public void shiftUp(int[] array,int child){//这里模拟的是大根堆的情况int parent=(child-1)/2;while(child>0){if(array[parent]>array[child]){break;}else {int t=array[child];array[parent]=array[child];array[child]=t;child=parent;parent=(child-1)/2;}}}

删除:

  • 对于堆的删除是十分重要的,想想我们在文章开始的时候,是不是说过,堆的底层逻辑是一种线性结构,本质上我们可以使用数组实现,那么如果把他转化为数组的时候,我们知道数组的元素其实是不能删除掉的,只能对数据进行覆盖,来完成元素的删除。堆在这里也是一样。

堆删除的具体步骤如下:

  • 将待删除的元素与二叉树的最后一个叶子结点进行交换
  • 将堆的底层数组内的有效数据个数减一
  • 把整个二叉树进行向下调整,重新调整二叉树的结构实现大根堆或者小根堆

在这里插入图片描述

 public int poll() {if(isEmpty()) {return -1;}int old = elem[0];swap(0,usedSize-1);usedSize--;siftDown(0,usedSize);return old;}

有关堆的一些常见接口介绍:

在java中我们并不需要自己去实现堆,java是一门高级语言,我们只需要知道每种重要的数据结构底层是如何实现的,然后我们直接使用系统为我们提供的结构就好了。

Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的,这里主要介绍PriorityQueue。

在这里插入图片描述
关于PriorityQueue的使用要注意:

  1. 使用时必须导入PriorityQueue所在的包,即:
java import java.util.PriorityQueue;
  1. PriorityQueue中放置的元素必须要能够比较大小,不能插入无法比较 大小的对 象,否则会抛出ClassCastException异常
  2. 不能插入null对象,否则会抛出NullPointerException
  3. 没有容量限制,可以插入任意多个元素,其内部可以自动扩容
  4. 插入和删除元素的时间复杂度为O( l o g n logn logn)
  5. PriorityQueue底层使用了堆数据结构
  6. PriorityQueue默认情况下是小堆—即每次获取到的元素都是最小的元素

当然我们也要熟悉对于堆的一些基础操作:

在这里插入图片描述

static void TestPriorityQueue2(){
int[] arr = {4,1,9,2,8,0,7,3,6,5};
// 一般在创建优先级队列对象时,如果知道元素个数,建议就直接将底层容量给好
// 否则在插入时需要不多的扩容
// 扩容机制:开辟更大的空间,拷贝元素,这样效率会比较低
PriorityQueue<Integer> q = new PriorityQueue<>(arr.length);
for (int e: arr) {
q.offer(e);
}
System.out.println(q.size()); // 打印优先级队列中有效元素个数
System.out.println(q.peek()); // 获取优先级最高的元素
// 从优先级队列中删除两个元素之和,再次获取优先级最高的元素
q.poll();
q.poll();
System.out.println(q.size()); // 打印优先级队列中有效元素个数
System.out.println(q.peek()); // 获取优先级最高的元素
q.offer(0);
System.out.println(q.peek()); // 获取优先级最高的元素
// 将优先级队列中的有效元素删除掉,检测其是否为空
q.clear();
if(q.isEmpty()){
System.out.println("优先级队列已经为空!!!");
}
else{
System.out.println("优先级队列不为空");
}
}

优先级队列的扩容说明:

  • 如果容量小于64时,是按照oldCapacity的2倍方式扩容的
  • 如果容量大于等于64,是按照oldCapacity的1.5倍方式扩容的
  • 如果容量超过MAX_ARRAY_SIZE,按照MAX_ARRAY_SIZE来进行扩容

堆的应用-TopK问题

对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都
不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:

我们最先想到的,就是创建一个小根堆把前k个元素放进去,然后接着遍历数组将较小的元素换进去,最后将堆的元素放到一个数组中返回这个数组就好

class IntCmp implements Comparator<Integer> {@Overridepublic int compare(Integer o1, Integer o2) {return o2.compareTo(o1);}
}
public class Test {/*虽然 通过了 但是 不是非常好的解决方案*/public static int[] smallestK1(int[] arr, int k) {PriorityQueue<Integer> minHeap = new PriorityQueue<>();for (int i = 0; i < arr.length; i++) {minHeap.offer(arr[i]);}int[] tmp = new int[k];for (int i = 0; i < k; i++) {int val = minHeap.poll();tmp[i] = val;}return tmp;}

这段代码虽然可以提交成功,但是并非是最优的解法,最规范的解法,是这样的:

  1. 用数据集合中前K个元素来建堆
    前k个最大的元素,则建小堆
    前k个最小的元素,则建大堆

  2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素
    将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。

class IntCmp implements Comparator<Integer> {@Overridepublic int compare(Integer o1, Integer o2) {return o2.compareTo(o1);}
}
class Solution {public static int[] smallestK(int[] arr, int k) {int[] tmp = new int[k];if(k == 0) {return tmp;}PriorityQueue<Integer> maxHeap = new PriorityQueue<>(new IntCmp());//1.把前K个元素放进堆中for (int i = 0; i < k; i++) {maxHeap.offer(arr[i]);}//2.遍历剩下的N-K个元素for (int i = k; i < arr.length; i++) {int val = maxHeap.peek();if(val > arr[i]) {maxHeap.poll();maxHeap.offer(arr[i]);}}for (int i = 0; i < k; i++) {tmp[i] = maxHeap.poll();}return tmp;}
}

好了,今天就分享到这里,期待大家的一键三连!!!

这篇关于【java数据结构-优先级队列向下调整Topk问题,堆的常用的接口详解】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/939659

相关文章

Java实现Excel与HTML互转

《Java实现Excel与HTML互转》Excel是一种电子表格格式,而HTM则是一种用于创建网页的标记语言,虽然两者在用途上存在差异,但有时我们需要将数据从一种格式转换为另一种格式,下面我们就来看看... Excel是一种电子表格格式,广泛用于数据处理和分析,而HTM则是一种用于创建网页的标记语言。虽然两

java图像识别工具类(ImageRecognitionUtils)使用实例详解

《java图像识别工具类(ImageRecognitionUtils)使用实例详解》:本文主要介绍如何在Java中使用OpenCV进行图像识别,包括图像加载、预处理、分类、人脸检测和特征提取等步骤... 目录前言1. 图像识别的背景与作用2. 设计目标3. 项目依赖4. 设计与实现 ImageRecogni

Java中Springboot集成Kafka实现消息发送和接收功能

《Java中Springboot集成Kafka实现消息发送和接收功能》Kafka是一个高吞吐量的分布式发布-订阅消息系统,主要用于处理大规模数据流,它由生产者、消费者、主题、分区和代理等组件构成,Ka... 目录一、Kafka 简介二、Kafka 功能三、POM依赖四、配置文件五、生产者六、消费者一、Kaf

Java访问修饰符public、private、protected及默认访问权限详解

《Java访问修饰符public、private、protected及默认访问权限详解》:本文主要介绍Java访问修饰符public、private、protected及默认访问权限的相关资料,每... 目录前言1. public 访问修饰符特点:示例:适用场景:2. private 访问修饰符特点:示例:

python管理工具之conda安装部署及使用详解

《python管理工具之conda安装部署及使用详解》这篇文章详细介绍了如何安装和使用conda来管理Python环境,它涵盖了从安装部署、镜像源配置到具体的conda使用方法,包括创建、激活、安装包... 目录pytpshheraerUhon管理工具:conda部署+使用一、安装部署1、 下载2、 安装3

详解Java如何向http/https接口发出请求

《详解Java如何向http/https接口发出请求》这篇文章主要为大家详细介绍了Java如何实现向http/https接口发出请求,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 用Java发送web请求所用到的包都在java.net下,在具体使用时可以用如下代码,你可以把它封装成一

关于@MapperScan和@ComponentScan的使用问题

《关于@MapperScan和@ComponentScan的使用问题》文章介绍了在使用`@MapperScan`和`@ComponentScan`时可能会遇到的包扫描冲突问题,并提供了解决方法,同时,... 目录@MapperScan和@ComponentScan的使用问题报错如下原因解决办法课外拓展总结@

MybatisGenerator文件生成不出对应文件的问题

《MybatisGenerator文件生成不出对应文件的问题》本文介绍了使用MybatisGenerator生成文件时遇到的问题及解决方法,主要步骤包括检查目标表是否存在、是否能连接到数据库、配置生成... 目录MyBATisGenerator 文件生成不出对应文件先在项目结构里引入“targetProje

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学