Java 你还在用list.contain做去重? 你是故意的还是不小心的?

2023-10-14 17:59
文章标签 java 小心 list contain 故意

本文主要是介绍Java 你还在用list.contain做去重? 你是故意的还是不小心的?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

最近又是一轮代码review , 发现了一些实现去重的代码,在使用 lsit.contain ......

如:

我沉思,是不是其实很多初学者也存在这种去重使用问题?

所以我选择把这个事情整出来,分享一下。

正文


首先是造出一个 List<String> 模拟数据,一共2W条,里面有一半数据1W条是重复的:

    public static List<String> getTestList() {List<String> list = new ArrayList<>();for (int i = 1; i <= 10000; i++) {list.add(String.valueOf(i));}for (int i = 10000; i >= 1; i--) {list.add(String.valueOf(i));}return list;}

先看看 我们用contain 去重的 代码:

    /*** 使用 list.contain 去重** @param testList*/private static void useContain2Distinct(List<String> testList) {System.out.println("contains 开始去重,条数:" + testList.size());List<String> testListDistinctResult = new ArrayList<>();for (String str : testList) {if (!testListDistinctResult.contains(str)) {testListDistinctResult.add(str);}}System.out.println("contains 去重完毕,条数:" + testListDistinctResult.size());}

我们调用一下看看耗时:

    public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();useContainDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());}

耗时:

 评价: list.contain 的效率,我的建议是,知道就行,别用。


众所周知Set 不存在 重复数据, 所以我们来看看 使用HashSet去重的性能:
ps: 这里是采取使用 set的add 方法做去重

    /*** 使用set去重** @param testList*/private static void useSetDistinct(List<String> testList) {System.out.println("HashSet.add 开始去重,条数:" + testList.size());List<String> testListDistinctResult = new ArrayList<>(new HashSet(testList));System.out.println("HashSet.add 去重完毕,条数:" + testListDistinctResult.size());}

我们调用一下看看耗时:

    public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();useSetDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());}

耗时:


评价:HashSet 的效率,我的建议是,推荐。


为什么耗时 差距这么大?

不多说,我们看源码:

list.contains(o):

 可以看到里面用到了 index(o) :

时间复杂度 : O(n) n: 元素个数

那么我们看看 set.add(o) 是怎么样的 :

map的add , 老生常谈就不谈了,hash完 直接塞到某个位置, 时间复杂度 : O(1)  。

所以 O(n) 和  O(1) 谁快  谁慢 ? 显然。

ps: 顺嘴说下 hashset的 contain  

时间复杂度也是 : O(1)   

那么我们最后再看看别的去重:
 

双for循环 ,remove去重 

    /*** 使用双for循环去重* @param testList*/private static void use2ForDistinct(List<String> testList) {System.out.println("list 双循环 开始去重,条数:" + testList.size());for (int i = 0; i < testList.size(); i++) {for (int j = i + 1; j < testList.size(); j++) {if (testList.get(i).equals(testList.get(j))) {testList.remove(j);}}}System.out.println("list 双循环  去重完毕,条数:" + testList.size());}
    public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();use2ForDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());}

耗时:

 评价:知道就行,图个乐,别用,贼慢,而且代码看起来乱:。


stream的distinct去重:
 

    /*** 使用Stream 去重** @param testList*/private static void useStreamDistinct(List<String> testList) {System.out.println("stream 开始去重,条数:" + testList.size());List<String> testListDistinctResult = testList.stream().distinct().collect(Collectors.toList());System.out.println("stream 去重完毕,条数:" + testListDistinctResult.size());}
    public static void main(String[] args) {List<String> testList = getTestList();StopWatch stopWatch = new StopWatch();stopWatch.start();useStreamDistinct(testList);stopWatch.stop();System.out.println("去重 最终耗时" + stopWatch.getTotalTimeMillis());}

耗时:

 评价:还不错,主要是代码也蛮简洁,有一点点动心。

好了,该篇就到这。

这篇关于Java 你还在用list.contain做去重? 你是故意的还是不小心的?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/212187

相关文章

Java 正则表达式URL 匹配与源码全解析

《Java正则表达式URL匹配与源码全解析》在Web应用开发中,我们经常需要对URL进行格式验证,今天我们结合Java的Pattern和Matcher类,深入理解正则表达式在实际应用中... 目录1.正则表达式分解:2. 添加域名匹配 (2)3. 添加路径和查询参数匹配 (3) 4. 最终优化版本5.设计思

Java使用ANTLR4对Lua脚本语法校验详解

《Java使用ANTLR4对Lua脚本语法校验详解》ANTLR是一个强大的解析器生成器,用于读取、处理、执行或翻译结构化文本或二进制文件,下面就跟随小编一起看看Java如何使用ANTLR4对Lua脚本... 目录什么是ANTLR?第一个例子ANTLR4 的工作流程Lua脚本语法校验准备一个Lua Gramm

Java字符串操作技巧之语法、示例与应用场景分析

《Java字符串操作技巧之语法、示例与应用场景分析》在Java算法题和日常开发中,字符串处理是必备的核心技能,本文全面梳理Java中字符串的常用操作语法,结合代码示例、应用场景和避坑指南,可快速掌握字... 目录引言1. 基础操作1.1 创建字符串1.2 获取长度1.3 访问字符2. 字符串处理2.1 子字

Java Optional的使用技巧与最佳实践

《JavaOptional的使用技巧与最佳实践》在Java中,Optional是用于优雅处理null的容器类,其核心目标是显式提醒开发者处理空值场景,避免NullPointerExce... 目录一、Optional 的核心用途二、使用技巧与最佳实践三、常见误区与反模式四、替代方案与扩展五、总结在 Java

基于Java实现回调监听工具类

《基于Java实现回调监听工具类》这篇文章主要为大家详细介绍了如何基于Java实现一个回调监听工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录监听接口类 Listenable实际用法打印结果首先,会用到 函数式接口 Consumer, 通过这个可以解耦回调方法,下面先写一个

使用Java将DOCX文档解析为Markdown文档的代码实现

《使用Java将DOCX文档解析为Markdown文档的代码实现》在现代文档处理中,Markdown(MD)因其简洁的语法和良好的可读性,逐渐成为开发者、技术写作者和内容创作者的首选格式,然而,许多文... 目录引言1. 工具和库介绍2. 安装依赖库3. 使用Apache POI解析DOCX文档4. 将解析

Java字符串处理全解析(String、StringBuilder与StringBuffer)

《Java字符串处理全解析(String、StringBuilder与StringBuffer)》:本文主要介绍Java字符串处理全解析(String、StringBuilder与StringBu... 目录Java字符串处理全解析:String、StringBuilder与StringBuffer一、St

springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法

《springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法》:本文主要介绍springboot整合阿里云百炼DeepSeek实现sse流式打印,本文给大家介绍的非常详细,对大... 目录1.开通阿里云百炼,获取到key2.新建SpringBoot项目3.工具类4.启动类5.测试类6.测

Spring Boot循环依赖原理、解决方案与最佳实践(全解析)

《SpringBoot循环依赖原理、解决方案与最佳实践(全解析)》循环依赖指两个或多个Bean相互直接或间接引用,形成闭环依赖关系,:本文主要介绍SpringBoot循环依赖原理、解决方案与最... 目录一、循环依赖的本质与危害1.1 什么是循环依赖?1.2 核心危害二、Spring的三级缓存机制2.1 三

在Spring Boot中浅尝内存泄漏的实战记录

《在SpringBoot中浅尝内存泄漏的实战记录》本文给大家分享在SpringBoot中浅尝内存泄漏的实战记录,结合实例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧... 目录使用静态集合持有对象引用,阻止GC回收关键点:可执行代码:验证:1,运行程序(启动时添加JVM参数限制堆大小):2,访问 htt