如何使用 arrayList.removeAll(Collection<?> c)?

2023-10-17 14:15

本文主要是介绍如何使用 arrayList.removeAll(Collection<?> c)?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

引言

对于 Collection 集合及其实现类都有 removeAll(Collection<?> c)

对于ArrayList 的实例对象,在数据比较多的情况下,方法 removeAll() 的传参 c 的类型是 HashSet会比是 ArrayList 的情况快的多。

原因

我们来细看一下ArrayList类的removeAll()方法实现的伪代码。

如:arrayList.removeAll(subList);// 遍历底层数组,将不需要删除的元素放在数组前面,后面的全部置为 null
// w 为要删除和不删除的分界线
int w = 0;
for(var value in 该 arrayList 的底层数组){if(!subList.contains(value)){该 arrayList 的底层数组 [w] = value;w++;}
}

这里影响速率关键的一步是:subList.contains(value)

这是因为contains()方法在不同类中的实现是存在差异的。

对于 ArrayList.contains(),它的实现是调用 indexOf(),一个一个地遍历查找。最坏时间复杂度为O(总数据量)。

而对于 HashSet.contains(),由于 HashSet 的底层是 HashMap,因此实际调用的是 HashMapcontainsKey()方法,该方法是通过哈希计算的方式去查询的,因此速度十分快。最坏的时间复杂度约为O(最长链表长度),而链表长度一般不会过大。

使用方法

在数据量比较大的的情况下,使用arrayList.removeAll(subList)时,可以将subList封装为HashSet

arrayList.removeAll(new HashSet(subList));

速度实测:

数据量ArrayListHashSetLinkedList
10 万1094 毫秒6 毫秒1133 毫秒
20 万4140毫秒8 毫秒4241 毫秒
50 万51431毫秒30 毫秒34380 毫秒
100 万140444 毫秒36 毫秒179465 毫秒
500 万9130706 毫秒79 毫秒10549229 毫秒

测试用的代码:

public class RemoveAllTest {public static void main(String[] args) {ArrayList<Integer> arrayList = new ArrayList<>();for (int i = 0; i < 5000000; i++) {arrayList.add(i);}ArrayList<Integer> subList = new ArrayList<>();for (int i = 0; i < 5000000; i++) {subList.add(i);i += 2;}// 测试入参为 ArrayList 类型时 removeAll() 的性能long startTime = System.currentTimeMillis();arrayList.removeAll(subList);long endTime = System.currentTimeMillis();System.out.println("ArrayList 耗时:" + (endTime - startTime));// 测试入参为 HashSet 类型时 removeAll() 的性能ArrayList<Integer> arrayList2 = new ArrayList<>();for (int i = 0; i < 5000000; i++) {arrayList2.add(i);}startTime = System.currentTimeMillis();arrayList2.removeAll(new HashSet<>(subList));endTime = System.currentTimeMillis();System.out.println("HashSet 耗时:" + (endTime - startTime));// 测试将 ArrayList 类型转成 LinkedList 类型ArrayList<Integer> arrayList3 = new ArrayList<>();for (int i = 0; i < 5000000; i++) {arrayList3.add(i);}startTime = System.currentTimeMillis();new LinkedList(arrayList3).removeAll(subList);endTime = System.currentTimeMillis();System.out.println("LinkedList 耗时:" + (endTime - startTime));}
}

HashSet 、LinkedList 中 removeAll() 方法的区别

在这里插入图片描述

不同类的 removeAll() 方法实现不同,可以看到对于 HashSetLinkedList,他们的 removeAll() 方法是通过父类或超父类的迭代器进行实现的,而 ArrayList 是自己通过 for 循环进行了实现。

HashSet 内部实现

依托于 AbstractSet 类的 removeAll(Collection<?> c) 方法,实现的逻辑是:

先调原集合对象 HashSetremoveAll(Collection<?> c) 方法中传入的参数 c 的 size() 方法,用来判断谁包含的元素更多。

  • 如果原集合对象的元素数量 > c 中元素数量,那么调用 c 的代器去遍历 c ,查看元素是否包含在原集合中,并使用原集合的 remove() 方法去删除元素。时间复杂度为 O(n)。

  • 如果原集合对象的元素数量 < c 中元素数量,那么调用原集合对象的迭代器去遍历原集合,检查元素是否包含在 c 中,并调用原集合迭代器的 remove() 方法去删除元素。这里的时间复杂度与集合 c 的 contains() 方法的实现有关:

    • 如果 c 是一个 ArrayListcontains() 方法的时间复杂度是 O( m )。因此,从集合 HashSet 中删除 ArrayList 中存在的所有元素的总体时间复杂度为 O( n * m )。

    • 如果 c 再次是 HashSet,则 contains() 方法的时间复杂度为 O(1)。因此,从集合 HashSet 中删除 HashSet 中存在的所有元素的总体时间复杂度为 O( n )。

public boolean removeAll(Collection<?> c) {Objects.requireNonNull(c);boolean modified = false;if (size() > c.size()) {for (Iterator<?> i = c.iterator(); i.hasNext(); )modified |= remove(i.next());} else {for (Iterator<?> i = iterator(); i.hasNext(); ) {if (c.contains(i.next())) {i.remove();modified = true;}}}return modified;
}

LinkedList 内部实现

public boolean removeAll(Collection<?> c) {Objects.requireNonNull(c);boolean modified = false;Iterator<?> it = iterator();while (it.hasNext()) {if (c.contains(it.next())) {it.remove();modified = true;}}return modified;
}

通过 contains() 方法来判断是否存在相同的元素,效率与 c 的类型有关。

参考

  • 为什么arrayList.removeAll(set)的速度远高于arrayList.removeAll(list)?

  • Java 中 HashSet 的 removeAll 性能分析

这篇关于如何使用 arrayList.removeAll(Collection<?> c)?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/225940

相关文章

使用Java将DOCX文档解析为Markdown文档的代码实现

《使用Java将DOCX文档解析为Markdown文档的代码实现》在现代文档处理中,Markdown(MD)因其简洁的语法和良好的可读性,逐渐成为开发者、技术写作者和内容创作者的首选格式,然而,许多文... 目录引言1. 工具和库介绍2. 安装依赖库3. 使用Apache POI解析DOCX文档4. 将解析

Qt中QUndoView控件的具体使用

《Qt中QUndoView控件的具体使用》QUndoView是Qt框架中用于可视化显示QUndoStack内容的控件,本文主要介绍了Qt中QUndoView控件的具体使用,具有一定的参考价值,感兴趣的... 目录引言一、QUndoView 的用途二、工作原理三、 如何与 QUnDOStack 配合使用四、自

C++使用printf语句实现进制转换的示例代码

《C++使用printf语句实现进制转换的示例代码》在C语言中,printf函数可以直接实现部分进制转换功能,通过格式说明符(formatspecifier)快速输出不同进制的数值,下面给大家分享C+... 目录一、printf 原生支持的进制转换1. 十进制、八进制、十六进制转换2. 显示进制前缀3. 指

使用Python构建一个Hexo博客发布工具

《使用Python构建一个Hexo博客发布工具》虽然Hexo的命令行工具非常强大,但对于日常的博客撰写和发布过程,我总觉得缺少一个直观的图形界面来简化操作,下面我们就来看看如何使用Python构建一个... 目录引言Hexo博客系统简介设计需求技术选择代码实现主框架界面设计核心功能实现1. 发布文章2. 加

shell编程之函数与数组的使用详解

《shell编程之函数与数组的使用详解》:本文主要介绍shell编程之函数与数组的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录shell函数函数的用法俩个数求和系统资源监控并报警函数函数变量的作用范围函数的参数递归函数shell数组获取数组的长度读取某下的

使用Python开发一个带EPUB转换功能的Markdown编辑器

《使用Python开发一个带EPUB转换功能的Markdown编辑器》Markdown因其简单易用和强大的格式支持,成为了写作者、开发者及内容创作者的首选格式,本文将通过Python开发一个Markd... 目录应用概览代码结构与核心组件1. 初始化与布局 (__init__)2. 工具栏 (setup_t

Python虚拟环境终极(含PyCharm的使用教程)

《Python虚拟环境终极(含PyCharm的使用教程)》:本文主要介绍Python虚拟环境终极(含PyCharm的使用教程),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录一、为什么需要虚拟环境?二、虚拟环境创建方式对比三、命令行创建虚拟环境(venv)3.1 基础命令3

Python Transformer 库安装配置及使用方法

《PythonTransformer库安装配置及使用方法》HuggingFaceTransformers是自然语言处理(NLP)领域最流行的开源库之一,支持基于Transformer架构的预训练模... 目录python 中的 Transformer 库及使用方法一、库的概述二、安装与配置三、基础使用:Pi

关于pandas的read_csv方法使用解读

《关于pandas的read_csv方法使用解读》:本文主要介绍关于pandas的read_csv方法使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录pandas的read_csv方法解读read_csv中的参数基本参数通用解析参数空值处理相关参数时间处理相关

使用Node.js制作图片上传服务的详细教程

《使用Node.js制作图片上传服务的详细教程》在现代Web应用开发中,图片上传是一项常见且重要的功能,借助Node.js强大的生态系统,我们可以轻松搭建高效的图片上传服务,本文将深入探讨如何使用No... 目录准备工作搭建 Express 服务器配置 multer 进行图片上传处理图片上传请求完整代码示例