java8 stream_Java Stream:第2部分,计数始终是计数吗?

2024-03-19 17:20
文章标签 java 计数 stream 部分 始终

本文主要是介绍java8 stream_Java Stream:第2部分,计数始终是计数吗?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

java8 stream

java8 stream

在上一篇有关该主题的文章中,我们了解到JDK 8stream()::count需要更长的时间来执行Stream更多的元素。 对于较新的JDK(例如Java 11),简单流管道不再是这种情况。 了解JDK本身如何进行改进。

Java 8

在上一篇文章中,我们可以得出以下结论:list.stream().count()在Java 8下为O(N) ,即执行时间取决于原始列表中的元素数。 阅读文章在这里。

Java 9及更高版本

正如Nikolai Parlog(@nipafx)和Brian Goetz(@BrianGoetz)在Twitter上正确指出的那样,从Java 9开始改进了Stream::count的实现。这是对底层代码的比较Java 8和更高Java版本之间的Stream::count代码:

Java 8(来自ReferencePipeline类)

return mapToLong(e -> 1L).sum();

Java 9及更高版本(来自ReduceOps类)

 if (StreamOpFlag.SIZED.isKnown(flags)) {return spliterator.getExactSizeIfKnown();}
...

对于Java 9和更高版本的分离器来说, Stream::count似乎是O(1) ,而不是O(N) 。 让我们验证该假设。

基准测试

通过在Java 8和Java 11下运行以下JMH基准可以观察到big-O属性:

 @State (Scope.Benchmark)public class CountBenchmark { private List<Integer> list; @Param ({ "1" , "1000" , "1000000" })private int size; @Setuppublic void setup() {list = IntStream.range( 0 , size).boxed().collect(toList());}@Benchmarkpublic long listSize() {return list.size();}@Benchmarkpublic long listStreamCount() {return list.stream().count();}public static void main(String[] args) throws RunnerException {Options opt = new OptionsBuilder().include(CountBenchmark. class .getSimpleName()).mode(Mode.Throughput).threads(Threads.MAX).forks( 1 ).warmupIterations( 5 ).measurementIterations( 5 ).build();new Runner(opt).run(); }}

这将在我的笔记本电脑(2015年中的MacBook Pro,2.2 GHz Intel Core i7)上产生以下输出:

JDK 8(来自上一篇文章)

 Benchmark                       (size)  Mode Cnt         Score          Error UnitsCountBenchmark.listSize 1 thrpt 5 966658591.905 ± 175787129.100 ops/sCountBenchmark.listSize 1000 thrpt 5 862173760.015 ± 293958267.033 ops/sCountBenchmark.listSize 1000000 thrpt 5 879607621.737 ± 107212069.065 ops/sCountBenchmark.listStreamCount 1 thrpt 5 39570790.720 ± 3590270.059 ops/sCountBenchmark.listStreamCount 1000 thrpt 5 30383397.354 ± 10194137.917 ops/sCountBenchmark.listStreamCount 1000000 thrpt 5 398.959 ± 170.737 ops/s

JDK 11

 Benchmark                                 (size)  Mode Cnt         Score          Error UnitsCountBenchmark.listSize 1 thrpt 5 898916944.365 ± 235047181.830 ops/sCountBenchmark.listSize 1000 thrpt 5 865080967.750 ± 203793349.257 ops/sCountBenchmark.listSize 1000000 thrpt 5 935820818.641 ± 95756219.869 ops/sCountBenchmark.listStreamCount 1 thrpt 5 95660206.302 ± 27337762.894 ops/sCountBenchmark.listStreamCount 1000 thrpt 5 78899026.467 ± 26299885.209 ops/sCountBenchmark.listStreamCount 1000000 thrpt 5 83223688.534 ± 16119403.504 ops/s

可以看出,在Java 11中, list.stream().count()操作现在是O(1)而不是O(N)

Brian Goetz 指出,一些在Java 8下使用Stream::peek方法调用的开发人员发现,如果Stream::count终端操作在Java 9及更高版本下运行,则不再调用这些方法。 这给JDK开发人员带来了一些负面反馈。 就个人而言,我认为这是JDK开发人员的正确决定,相反,这为Stream::peek用户使他们的代码正确。

更复杂的流管道

在本章中,我们将介绍更复杂的流管道。

JDK 11

Tagir Valeev 得出结论,对于List::stream ,类似stream().skip(1).count()类的管道不是O(1) 。通过运行以下基准可以观察到这一点:

 @Benchmarkpublic long listStreamSkipCount() {return list.stream().skip( 1 ).count();}
 CountBenchmark.listStreamCount 1 thrpt 5 105546649.075 ± 10529832.319 ops/sCountBenchmark.listStreamCount 1000 thrpt 5 81370237.291 ± 15566491.838 ops/sCountBenchmark.listStreamCount 1000000 thrpt 5 75929699.395 ± 14784433.428 ops/sCountBenchmark.listStreamSkipCount 1 thrpt 5 35809816.451 ± 12055461.025 ops/sCountBenchmark.listStreamSkipCount 1000 thrpt 5 3098848.946 ± 339437.339 ops/sCountBenchmark.listStreamSkipCount 1000000 thrpt 5 3646.513 ± 254.442 ops/s

因此, list.stream().skip(1).count()仍为O(N)。

加速

一些流实现实际上知道它们的源,并且可以采用适当的快捷方式并将流操作合并到流源本身中。 这可以极大地提高性能,尤其是对于具有更复杂的流管道(例如stream().skip(1).count()大型流stream().skip(1).count()

Speedment ORM工具允许将数据库视为Stream对象,并且这些流可以优化许多流操作,例如Stream::countStream::skipStream::limit操作,如下面的基准所示。 我已使用开源Sakila示例数据库作为数据输入。 Sakila数据库包含有关租赁电影,艺术家等的全部信息。

 @Benchmarkpublic long rentalsSkipCount() {return rentals.stream().skip( 1 ).count();}@Benchmarkpublic long filmsSkipCount() {return films.stream().skip( 1 ).count();}

运行时,将产生以下输出:

 SpeedmentCountBenchmark.filmsSkipCount       N/A thrpt 5 68052838.621 ± 739171.008 ops/sSpeedmentCountBenchmark.rentalsSkipCount     N/A thrpt 5 68224985.736 ± 2683811.510 ops/s

“租赁”表包含10,000行,而“电影”表仅包含1,000行。 但是,它们的stream().skip(1).count()操作几乎同时完成。 即使一个表包含一万亿行,它仍然会在相同的经过时间内对元素进行计数。 因此, stream().skip(1).count()实现的复杂度为O(1)而不是O(N)

注意:上面的基准测试是通过“ DataStore” JVM内存中加速来运行的。 如果直接对数据库没有加速运行,则响应时间将取决于基础数据库执行嵌套“SELECT count(*) …”语句的能力。

概要

在Java 9中, Stream::count显着改善。

有一些流实现,例如Speedment,即使在更复杂的流管道(例如stream().skip(...).count()甚至stream.filter(...).skip(...).count() stream().skip(...).count() ,也能够在O(1)时间内计算Stream::count stream().skip(...).count() stream.filter(...).skip(...).count()

资源资源

Speedment Stream ORM初始化程序: https ://www.speedment.com/initializer/

Sakila: https ://dev.mysql.com/doc/index-other.html或https://hub.docker.com/r/restsql/mysql-sakila

翻译自: https://www.javacodegeeks.com/2019/04/java-stream-part-2-count-always-count.html

java8 stream

这篇关于java8 stream_Java Stream:第2部分,计数始终是计数吗?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/826721

相关文章

Java设计模式---迭代器模式(Iterator)解读

《Java设计模式---迭代器模式(Iterator)解读》:本文主要介绍Java设计模式---迭代器模式(Iterator),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录1、迭代器(Iterator)1.1、结构1.2、常用方法1.3、本质1、解耦集合与遍历逻辑2、统一

Java内存分配与JVM参数详解(推荐)

《Java内存分配与JVM参数详解(推荐)》本文详解JVM内存结构与参数调整,涵盖堆分代、元空间、GC选择及优化策略,帮助开发者提升性能、避免内存泄漏,本文给大家介绍Java内存分配与JVM参数详解,... 目录引言JVM内存结构JVM参数概述堆内存分配年轻代与老年代调整堆内存大小调整年轻代与老年代比例元空

深度解析Java DTO(最新推荐)

《深度解析JavaDTO(最新推荐)》DTO(DataTransferObject)是一种用于在不同层(如Controller层、Service层)之间传输数据的对象设计模式,其核心目的是封装数据,... 目录一、什么是DTO?DTO的核心特点:二、为什么需要DTO?(对比Entity)三、实际应用场景解析

Java 线程安全与 volatile与单例模式问题及解决方案

《Java线程安全与volatile与单例模式问题及解决方案》文章主要讲解线程安全问题的五个成因(调度随机、变量修改、非原子操作、内存可见性、指令重排序)及解决方案,强调使用volatile关键字... 目录什么是线程安全线程安全问题的产生与解决方案线程的调度是随机的多个线程对同一个变量进行修改线程的修改操

从原理到实战深入理解Java 断言assert

《从原理到实战深入理解Java断言assert》本文深入解析Java断言机制,涵盖语法、工作原理、启用方式及与异常的区别,推荐用于开发阶段的条件检查与状态验证,并强调生产环境应使用参数验证工具类替代... 目录深入理解 Java 断言(assert):从原理到实战引言:为什么需要断言?一、断言基础1.1 语

深度解析Java项目中包和包之间的联系

《深度解析Java项目中包和包之间的联系》文章浏览阅读850次,点赞13次,收藏8次。本文详细介绍了Java分层架构中的几个关键包:DTO、Controller、Service和Mapper。_jav... 目录前言一、各大包1.DTO1.1、DTO的核心用途1.2. DTO与实体类(Entity)的区别1

Java中的雪花算法Snowflake解析与实践技巧

《Java中的雪花算法Snowflake解析与实践技巧》本文解析了雪花算法的原理、Java实现及生产实践,涵盖ID结构、位运算技巧、时钟回拨处理、WorkerId分配等关键点,并探讨了百度UidGen... 目录一、雪花算法核心原理1.1 算法起源1.2 ID结构详解1.3 核心特性二、Java实现解析2.

SpringBoot整合liteflow的详细过程

《SpringBoot整合liteflow的详细过程》:本文主要介绍SpringBoot整合liteflow的详细过程,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋...  liteflow 是什么? 能做什么?总之一句话:能帮你规范写代码逻辑 ,编排并解耦业务逻辑,代码

JavaSE正则表达式用法总结大全

《JavaSE正则表达式用法总结大全》正则表达式就是由一些特定的字符组成,代表的是一个规则,:本文主要介绍JavaSE正则表达式用法的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录常用的正则表达式匹配符正则表China编程达式常用的类Pattern类Matcher类PatternSynta

Spring Security中用户名和密码的验证完整流程

《SpringSecurity中用户名和密码的验证完整流程》本文给大家介绍SpringSecurity中用户名和密码的验证完整流程,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定... 首先创建了一个UsernamePasswordAuthenticationTChina编程oken对象,这是S