Java 你还在用list.contain做去重? 你是故意的还是不小心的?

2023-10-14 17:59
文章标签 java 小心 list contain 故意

本文主要是介绍Java 你还在用list.contain做去重? 你是故意的还是不小心的?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

最近又是一轮代码review , 发现了一些实现去重的代码,在使用 lsit.contain ......

如:

我沉思,是不是其实很多初学者也存在这种去重使用问题?

所以我选择把这个事情整出来,分享一下。

正文


首先是造出一个 List<String> 模拟数据,一共2W条,里面有一半数据1W条是重复的:

    public static List<String> getTestList() {List<String> list = new ArrayList<>();for (int i = 1; i <= 10000; i++) {list.add(String.valueOf(i));}for (int i = 10000; i >= 1; i--) {list.add(String.valueOf(i));}return list;}

先看看 我们用contain 去重的 代码:

    /*** 使用 list.contain 去重** @param testList*/private static void useContain2Distinct(List<String> testList) {System.out.println("contains 开始去重,条数:" + testList.size());List<String> testListDistinctResult = new ArrayList<>();for (String str : testList) {if (!testListDistinctResult.contains(str)) {testListDistinctResult.add(str);}}System.out.println("contains 去重完毕,条数:" + testListDistinctResult.size());}

我们调用一下看看耗时:

    public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();useContainDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());}

耗时:

 评价: list.contain 的效率,我的建议是,知道就行,别用。


众所周知Set 不存在 重复数据, 所以我们来看看 使用HashSet去重的性能:
ps: 这里是采取使用 set的add 方法做去重

    /*** 使用set去重** @param testList*/private static void useSetDistinct(List<String> testList) {System.out.println("HashSet.add 开始去重,条数:" + testList.size());List<String> testListDistinctResult = new ArrayList<>(new HashSet(testList));System.out.println("HashSet.add 去重完毕,条数:" + testListDistinctResult.size());}

我们调用一下看看耗时:

    public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();useSetDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());}

耗时:


评价:HashSet 的效率,我的建议是,推荐。


为什么耗时 差距这么大?

不多说,我们看源码:

list.contains(o):

 可以看到里面用到了 index(o) :

时间复杂度 : O(n) n: 元素个数

那么我们看看 set.add(o) 是怎么样的 :

map的add , 老生常谈就不谈了,hash完 直接塞到某个位置, 时间复杂度 : O(1)  。

所以 O(n) 和  O(1) 谁快  谁慢 ? 显然。

ps: 顺嘴说下 hashset的 contain  

时间复杂度也是 : O(1)   

那么我们最后再看看别的去重:
 

双for循环 ,remove去重 

    /*** 使用双for循环去重* @param testList*/private static void use2ForDistinct(List<String> testList) {System.out.println("list 双循环 开始去重,条数:" + testList.size());for (int i = 0; i < testList.size(); i++) {for (int j = i + 1; j < testList.size(); j++) {if (testList.get(i).equals(testList.get(j))) {testList.remove(j);}}}System.out.println("list 双循环  去重完毕,条数:" + testList.size());}
    public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();use2ForDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());}

耗时:

 评价:知道就行,图个乐,别用,贼慢,而且代码看起来乱:。


stream的distinct去重:
 

    /*** 使用Stream 去重** @param testList*/private static void useStreamDistinct(List<String> testList) {System.out.println("stream 开始去重,条数:" + testList.size());List<String> testListDistinctResult = testList.stream().distinct().collect(Collectors.toList());System.out.println("stream 去重完毕,条数:" + testListDistinctResult.size());}
    public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();useStreamDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());}

耗时:

 评价:还不错,主要是代码也蛮简洁,有一点点动心。

好了,该篇就到这。

这篇关于Java 你还在用list.contain做去重? 你是故意的还是不小心的?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/212187

相关文章

springboot健康检查监控全过程

《springboot健康检查监控全过程》文章介绍了SpringBoot如何使用Actuator和Micrometer进行健康检查和监控,通过配置和自定义健康指示器,开发者可以实时监控应用组件的状态,... 目录1. 引言重要性2. 配置Spring Boot ActuatorSpring Boot Act

使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)

《使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)》在现代软件开发中,处理JSON数据是一项非常常见的任务,无论是从API接口获取数据,还是将数据存储为JSON格式,解析... 目录1. 背景介绍1.1 jsON简介1.2 实际案例2. 准备工作2.1 环境搭建2.1.1 添加

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

java如何分布式锁实现和选型

《java如何分布式锁实现和选型》文章介绍了分布式锁的重要性以及在分布式系统中常见的问题和需求,它详细阐述了如何使用分布式锁来确保数据的一致性和系统的高可用性,文章还提供了基于数据库、Redis和Zo... 目录引言:分布式锁的重要性与分布式系统中的常见问题和需求分布式锁的重要性分布式系统中常见的问题和需求

SpringBoot基于MyBatis-Plus实现Lambda Query查询的示例代码

《SpringBoot基于MyBatis-Plus实现LambdaQuery查询的示例代码》MyBatis-Plus是MyBatis的增强工具,简化了数据库操作,并提高了开发效率,它提供了多种查询方... 目录引言基础环境配置依赖配置(Maven)application.yml 配置表结构设计demo_st

在Ubuntu上部署SpringBoot应用的操作步骤

《在Ubuntu上部署SpringBoot应用的操作步骤》随着云计算和容器化技术的普及,Linux服务器已成为部署Web应用程序的主流平台之一,Java作为一种跨平台的编程语言,具有广泛的应用场景,本... 目录一、部署准备二、安装 Java 环境1. 安装 JDK2. 验证 Java 安装三、安装 mys

Springboot的ThreadPoolTaskScheduler线程池轻松搞定15分钟不操作自动取消订单

《Springboot的ThreadPoolTaskScheduler线程池轻松搞定15分钟不操作自动取消订单》:本文主要介绍Springboot的ThreadPoolTaskScheduler线... 目录ThreadPoolTaskScheduler线程池实现15分钟不操作自动取消订单概要1,创建订单后

JAVA中整型数组、字符串数组、整型数和字符串 的创建与转换的方法

《JAVA中整型数组、字符串数组、整型数和字符串的创建与转换的方法》本文介绍了Java中字符串、字符数组和整型数组的创建方法,以及它们之间的转换方法,还详细讲解了字符串中的一些常用方法,如index... 目录一、字符串、字符数组和整型数组的创建1、字符串的创建方法1.1 通过引用字符数组来创建字符串1.2

SpringCloud集成AlloyDB的示例代码

《SpringCloud集成AlloyDB的示例代码》AlloyDB是GoogleCloud提供的一种高度可扩展、强性能的关系型数据库服务,它兼容PostgreSQL,并提供了更快的查询性能... 目录1.AlloyDBjavascript是什么?AlloyDB 的工作原理2.搭建测试环境3.代码工程1.

Java调用Python代码的几种方法小结

《Java调用Python代码的几种方法小结》Python语言有丰富的系统管理、数据处理、统计类软件包,因此从java应用中调用Python代码的需求很常见、实用,本文介绍几种方法从java调用Pyt... 目录引言Java core使用ProcessBuilder使用Java脚本引擎总结引言python