用ForkJoin框架为归并排序提速

2024-05-15 02:04

本文主要是介绍用ForkJoin框架为归并排序提速,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

归并排序典型的分治思想的算法。每层递归有三个步骤

  1. 分解(Divide):将n个元素分成个含n/2个元素的子序列。
  2. 解决(Conquer):用合并排序法对两个子序列递归的排序。
  3. 合并(Combine):合并两个已排序的子序列已得到排序结果。

使用递归算法的代码demo

public class SortArray {int[] tmp;public int[] sortArray(int[] nums) {tmp = new int[nums.length];mergeSort(nums, 0, nums.length - 1);return nums;}private void mergeSort(int[] nums, int left, int right) {if (left >= right) {return;}int middle = (left + right) / 2;mergeSort(nums, left, middle);int newLeft = middle + 1;mergeSort(nums, newLeft, right);int i = left, j = newLeft;int k = 0;while (i <= middle && j <= right) {if (nums[i] < nums[j]) {tmp[k++] = nums[i++];} else {tmp[k++] = nums[j++];}}while (i <= middle) {tmp[k++] = nums[i++];}while (j <= right) {tmp[k++] = nums[j++];}for (i = 0; i < k; i++) {nums[left + i] = tmp[i];}}public static void main(String[] args) {SortArray test  = new SortArray();int[]     array = test.sortArray(new int[]{5, 2, 3, 1});System.out.println(Arrays.toString(array));array = test.sortArray(new int[]{5, 1, 1, 2, 0, 0});System.out.println(Arrays.toString(array));}
}

写完之后,想到这个程序仅仅利用到了一个cpu核心,如果数据量很大的情况下,会造成计算资源的浪费。这个需要计算多个子任务的分治算法,明显可以用Fork/Join框架提速。于是改写了一版。当数据量小于1024个的时候不再进行切割,否则任务太多,提速效果十分差。当小于1024个的时候,偷懒用了工具库的快排。源码地址:https://github.com/bruce256/LeetCodeOJ/blob/master/src/main/java/divideAndConquer/SortArrayTask.java

public class SortArrayTask extends RecursiveTask<int[]> {public static final int THRESHOLD = 1024;int[] nums;int   left;int   right;int[] tmp;public SortArrayTask(int[] nums, int[] tmp, int left, int right) {this.nums  = nums;this.left  = left;this.right = right;this.tmp   = tmp;}@Overrideprotected int[] compute() {if (right - left + 1 <= THRESHOLD) {Arrays.sort(nums, left, right + 1);return null;}int middle = (left + right) / 2;// 当前任务纳入计算队列SortArrayTask leftSortArrayTask = new SortArrayTask(nums, tmp, left, middle);leftSortArrayTask.fork();int           newLeft            = middle + 1;SortArrayTask rightSortArrayTask = new SortArrayTask(nums, tmp, newLeft, right);rightSortArrayTask.fork();// 等待任务计算结束,再做这个语句后的事情leftSortArrayTask.join();rightSortArrayTask.join();int i = left, j = newLeft;int k = 0;while (i <= middle && j <= right) {if (nums[i] < nums[j]) {tmp[k++] = nums[i++];} else {tmp[k++] = nums[j++];}}while (i <= middle) {tmp[k++] = nums[i++];}while (j <= right) {tmp[k++] = nums[j++];}for (i = 0; i < k; i++) {nums[left + i] = tmp[i];}return nums;}public static void main(String[] args) {int[] array = {10000, 100000, 1000000, 10000000, 100000000};for (int num : array) {compare(num);}}private static void compare(int num) {int[]  nums   = new int[num];int[]  tmp    = new int[num];Random random = new Random();for (int i = 0; i < nums.length; i++) {nums[i] = random.nextInt();}System.out.println(nums.length + " numbers \t" + Runtime.getRuntime().availableProcessors() + " cpus");ForkJoinPool  forkJoinPool = new ForkJoinPool();SortArrayTask task         = new SortArrayTask(nums, tmp, 0, nums.length - 1);long          start        = System.currentTimeMillis();Future<int[]> result       = forkJoinPool.submit(task);try {int[] r = result.get();long duration = System.currentTimeMillis() - start;System.out.println("fork/join time cost: \t" + duration + " ms");} catch (InterruptedException e) {e.printStackTrace();} catch (ExecutionException e) {e.printStackTrace();}SortArray test = new SortArray();for (int i = 0; i < nums.length; i++) {nums[i] = random.nextInt();}start = System.currentTimeMillis();int[] array    = test.sortArray(nums);long  duration = System.currentTimeMillis() - start;System.out.println("single thread time cost: \t" + duration + " ms");}
}

我的电脑是i7 4核心8线程,跑了10000, 100000, 1000000, 10000000, 100000000个数据对别单线程和多线程版本,运行结果

10000 numbers 	8 cpus
fork/join time cost: 	5 ms
single thread time cost: 	4 ms100000 numbers 	8 cpus
fork/join time cost: 	29 ms
single thread time cost: 	29 ms1000000 numbers 	8 cpus
fork/join time cost: 	80 ms
single thread time cost: 	142 ms10000000 numbers 	8 cpus
fork/join time cost: 	235 ms
single thread time cost: 	1725 ms100000000 numbers 	8 cpus
fork/join time cost: 	2284 ms
single thread time cost: 	17275 ms

当数据量较小时,由于CPU上下文切换,导致并行还不如串行快。当数据量较大时,提速明显。

这篇关于用ForkJoin框架为归并排序提速的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/990493

相关文章

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

usaco 1.3 Mixing Milk (结构体排序 qsort) and hdu 2020(sort)

到了这题学会了结构体排序 于是回去修改了 1.2 milking cows 的算法~ 结构体排序核心: 1.结构体定义 struct Milk{int price;int milks;}milk[5000]; 2.自定义的比较函数,若返回值为正,qsort 函数判定a>b ;为负,a<b;为0,a==b; int milkcmp(const void *va,c

hdu 1285(拓扑排序)

题意: 给各个队间的胜负关系,让排名次,名词相同按从小到大排。 解析: 拓扑排序是应用于有向无回路图(Direct Acyclic Graph,简称DAG)上的一种排序方式,对一个有向无回路图进行拓扑排序后,所有的顶点形成一个序列,对所有边(u,v),满足u 在v 的前面。该序列说明了顶点表示的事件或状态发生的整体顺序。比较经典的是在工程活动上,某些工程完成后,另一些工程才能继续,此时

cross-plateform 跨平台应用程序-03-如果只选择一个框架,应该选择哪一个?

跨平台系列 cross-plateform 跨平台应用程序-01-概览 cross-plateform 跨平台应用程序-02-有哪些主流技术栈? cross-plateform 跨平台应用程序-03-如果只选择一个框架,应该选择哪一个? cross-plateform 跨平台应用程序-04-React Native 介绍 cross-plateform 跨平台应用程序-05-Flutte

Spring框架5 - 容器的扩展功能 (ApplicationContext)

private static ApplicationContext applicationContext;static {applicationContext = new ClassPathXmlApplicationContext("bean.xml");} BeanFactory的功能扩展类ApplicationContext进行深度的分析。ApplicationConext与 BeanF

数据治理框架-ISO数据治理标准

引言 "数据治理"并不是一个新的概念,国内外有很多组织专注于数据治理理论和实践的研究。目前国际上,主要的数据治理框架有ISO数据治理标准、GDI数据治理框架、DAMA数据治理管理框架等。 ISO数据治理标准 改标准阐述了数据治理的标准、基本原则和数据治理模型,是一套完整的数据治理方法论。 ISO/IEC 38505标准的数据治理方法论的核心内容如下: 数据治理的目标:促进组织高效、合理地

《数据结构(C语言版)第二版》第八章-排序(8.3-交换排序、8.4-选择排序)

8.3 交换排序 8.3.1 冒泡排序 【算法特点】 (1) 稳定排序。 (2) 可用于链式存储结构。 (3) 移动记录次数较多,算法平均时间性能比直接插入排序差。当初始记录无序,n较大时, 此算法不宜采用。 #include <stdio.h>#include <stdlib.h>#define MAXSIZE 26typedef int KeyType;typedef char In

【软考】希尔排序算法分析

目录 1. c代码2. 运行截图3. 运行解析 1. c代码 #include <stdio.h>#include <stdlib.h> void shellSort(int data[], int n){// 划分的数组,例如8个数则为[4, 2, 1]int *delta;int k;// i控制delta的轮次int i;// 临时变量,换值int temp;in

ZooKeeper 中的 Curator 框架解析

Apache ZooKeeper 是一个为分布式应用提供一致性服务的软件。它提供了诸如配置管理、分布式同步、组服务等功能。在使用 ZooKeeper 时,Curator 是一个非常流行的客户端库,它简化了 ZooKeeper 的使用,提供了高级的抽象和丰富的工具。本文将详细介绍 Curator 框架,包括它的设计哲学、核心组件以及如何使用 Curator 来简化 ZooKeeper 的操作。 1

【Kubernetes】K8s 的安全框架和用户认证

K8s 的安全框架和用户认证 1.Kubernetes 的安全框架1.1 认证:Authentication1.2 鉴权:Authorization1.3 准入控制:Admission Control 2.Kubernetes 的用户认证2.1 Kubernetes 的用户认证方式2.2 配置 Kubernetes 集群使用密码认证 Kubernetes 作为一个分布式的虚拟