topK 问题

2024-06-04 09:36
文章标签 问题 topk

本文主要是介绍topK 问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

topK 问题

  • topK
  • 二、实验内容
  • 三、数据结构设计
  • 四、算法设计
  • 五、运行结果
  • 六、程序源码

topK

(1)实验题目
topK 问题
(2)问题描述
从大批量数据序列中寻找最大的前 k 个数据,比如从 10 万个数据中,寻找最大的前 1000 个数。请给出最大前 k 个数据的和。

二、实验内容

(1)设计求解 topK 问题的存储结构;
(2)用伪代码描述算法,并分析时空性能;
(3)编程实现。

三、数据结构设计

典型的topK问题,由于题目要求的是最大的前K个数,所以使用小根堆,堆的大小为k,首先创建堆,此时堆的大小为k ,当再次插入元素时,和栈顶元素比较,如果比堆顶元素大,把堆顶元素删除,将该元素入堆;如果比堆顶元素小,不做任何处理.把所有的数据集合遍历完,此时,小根堆中的元素就是最大的前k 个数.,然后再对这k个数求和.
堆的成员变量:
public int[] elem ;//底层结构
public int usedSize;//标记元素个数
public interface IList {
void offer(int val);//插入
int poll();//删除堆顶元素
int peek();//查看堆顶元素
}

四、算法设计

(1)堆的插入:offer(int val) :
首先将元素插入数组的尾部,usedSize++,然后向上调整.
向上调整:shiftUp()
时间复杂度:O(log2 N)
空间复杂度:O(1)
初始条件child = usedSize ; 结束条件:child = 0
每次循环让parent = (child-1)/2, 可以理解成child 的父节点
循环体:
if(elem[child] < elem[parent] ),交换child 下标和parent下标的值,然后child = parent ,parent =( child -1) /2
否则直接退出循环.
(2)堆的删除:poll(int parent ,int len)
首先将elem[0] 和elem[usedSize]交换,usedSize–,然后向下调整
向下调整:shiftDown()
时间复杂度:O(log2 N)
空间复杂度:O(1)

五、运行结果

在这里插入图片描述

六、程序源码


```java
//接口
public interface IList {void offer(int val);//插入int poll();//删除堆顶元素int peek();//查看堆顶元素
}
public class TestHeap implements IList {public int[] elem ;public int usedSize;public TestHeap(int k){this.elem = new int[k];//初始容量}//堆的插入public void offer(int val){elem[usedSize] = val;usedSize++;//向上调整shiftUp(usedSize-1);}public void shiftUp(int child){int parent =(child -1) / 2;while(child > 0){if(elem[child] < elem[parent]){swap(child ,parent);child = parent;parent = (child -1 ) / 2;}else{break;}}}//堆的删除public int poll(){int tmp = elem[0];swap(0 ,usedSize-1);usedSize--;//向下调整shiftDown(0,usedSize);return tmp;}public int peek(){return elem[0];}private void shiftDown(int parent ,int len){int child = parent *2+1;while(child < len){if(child +1 < elem.length && elem[child] > elem[child+1]){child ++;}if(elem[parent] > elem[child]){swap(parent,child);parent =child ;child = 2* parent+1;}else {break;}}}private void swap(int i,int j){int tmp = elem[i];elem[i] = elem[j];elem[j] = tmp;}}
//测试类
public class Test {public static void main(String[] args) {Scanner scanner = new Scanner(System.in);System.out.println("请输入元素个数:");int count = scanner.nextInt();System.out.println("请输入要查找的序号: ");int k = scanner.nextInt();TestHeap testHeap =new TestHeap(k);System.out.println("请输入元素结合:");int[] array = new int[count];for (int i = 0; i < count; i++) {array[i] = scanner.nextInt();}//构建元素个数为k 的小根堆for (int i = 0; i < k; i++) {testHeap.offer(array[i]);}//确保小根堆中的元素是数据集合中的最大的for (int i = k; i < array.length; i++) {int tmp = array[i];if(tmp > testHeap.peek()){testHeap.poll();testHeap.offer(tmp);}}int sum = 0;for (int i = 0; i < k; i++) {sum += testHeap.poll();}System.out.println(sum);}
}

这篇关于topK 问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1029704

相关文章

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu

MySQL新增字段后Java实体未更新的潜在问题与解决方案

《MySQL新增字段后Java实体未更新的潜在问题与解决方案》在Java+MySQL的开发中,我们通常使用ORM框架来映射数据库表与Java对象,但有时候,数据库表结构变更(如新增字段)后,开发人员可... 目录引言1. 问题背景:数据库与 Java 实体不同步1.1 常见场景1.2 示例代码2. 不同操作

如何解决mysql出现Incorrect string value for column ‘表项‘ at row 1错误问题

《如何解决mysql出现Incorrectstringvalueforcolumn‘表项‘atrow1错误问题》:本文主要介绍如何解决mysql出现Incorrectstringv... 目录mysql出现Incorrect string value for column ‘表项‘ at row 1错误报错

如何解决Spring MVC中响应乱码问题

《如何解决SpringMVC中响应乱码问题》:本文主要介绍如何解决SpringMVC中响应乱码问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring MVC最新响应中乱码解决方式以前的解决办法这是比较通用的一种方法总结Spring MVC最新响应中乱码解

pip无法安装osgeo失败的问题解决

《pip无法安装osgeo失败的问题解决》本文主要介绍了pip无法安装osgeo失败的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 进入官方提供的扩展包下载网站寻找版本适配的whl文件注意:要选择cp(python版本)和你py

解决Java中基于GeoTools的Shapefile读取乱码的问题

《解决Java中基于GeoTools的Shapefile读取乱码的问题》本文主要讨论了在使用Java编程语言进行地理信息数据解析时遇到的Shapefile属性信息乱码问题,以及根据不同的编码设置进行属... 目录前言1、Shapefile属性字段编码的情况:一、Shp文件常见的字符集编码1、System编码

Spring MVC使用视图解析的问题解读

《SpringMVC使用视图解析的问题解读》:本文主要介绍SpringMVC使用视图解析的问题解读,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring MVC使用视图解析1. 会使用视图解析的情况2. 不会使用视图解析的情况总结Spring MVC使用视图

Redis解决缓存击穿问题的两种方法

《Redis解决缓存击穿问题的两种方法》缓存击穿问题也叫热点Key问题,就是⼀个被高并发访问并且缓存重建业务较复杂的key突然失效了,无数的请求访问会在瞬间给数据库带来巨大的冲击,本文给大家介绍了Re... 目录引言解决办法互斥锁(强一致,性能差)逻辑过期(高可用,性能优)设计逻辑过期时间引言缓存击穿:给

Java程序运行时出现乱码问题的排查与解决方法

《Java程序运行时出现乱码问题的排查与解决方法》本文主要介绍了Java程序运行时出现乱码问题的排查与解决方法,包括检查Java源文件编码、检查编译时的编码设置、检查运行时的编码设置、检查命令提示符的... 目录一、检查 Java 源文件编码二、检查编译时的编码设置三、检查运行时的编码设置四、检查命令提示符