使用 JMH 做 Kotlin 的基准测试

2024-01-08 22:58
一. 基准测试



二. JMH

JMH(Java Microbenchmark Harness) 是专门用于进行代码的微基准测试的一套工具API,也支持基于JVM的语言例如 Scala、Groovy、Kotlin。它是由 OpenJDK/Oracle 里面那群开发了 Java 编译器的大牛们所开发的工具。

三. 举例

首先,在 build.gradle 中添加 JMH 所需的依赖

  1. plugins {

  2.    id 'java'

  3.    id 'org.jetbrains.kotlin.jvm' version '1.3.10'

  4.    id "org.jetbrains.kotlin.kapt" version "1.3.10"

  5. }

  6. ...

  7. dependencies {

  8.    compile "org.jetbrains.kotlin:kotlin-stdlib-jdk8"

  9.    compile "org.jetbrains.kotlin:kotlin-reflect:1.3.10"

  10.    testCompile group: 'junit', name: 'junit', version: '4.12'

  11.    compile "org.openjdk.jmh:jmh-core:1.21"

  12.    kapt "org.openjdk.jmh:jmh-generator-annprocess:1.21"

  13.    ......

  14. }

3.1 对比 Sequence 和 List

在 Kotlin 1.2.70 的 release note 上曾说明:

使用 Sequence 有助于避免不必要的临时分配开销,并且可以显着提高复杂处理 PipeLines 的性能。


  1. import org.openjdk.jmh.annotations.*

  2. import org.openjdk.jmh.results.format.ResultFormatType

  3. import org.openjdk.jmh.runner.Runner

  4. import org.openjdk.jmh.runner.options.OptionsBuilder

  5. import java.util.concurrent.TimeUnit

  6. /**

  7. * Created by tony on 2018-12-10.

  8. */

  9. @BenchmarkMode(Mode.Throughput) // 基准测试的模式,采用整体吞吐量的模式

  10. @Warmup(iterations = 3) // 预热次数

  11. @Measurement(iterations = 10, time = 5, timeUnit = TimeUnit.SECONDS) // 测试参数,iterations = 10 表示进行10轮测试

  12. @Threads(8) // 每个进程中的测试线程数

  13. @Fork(2)  // 进行 fork 的次数,表示 JMH 会 fork 出两个进程来进行测试

  14. @OutputTimeUnit(TimeUnit.MILLISECONDS) // 基准测试结果的时间类型

  15. open class SequenceBenchmark {

  16.    @Benchmark

  17.    fun testSequence():Int {

  18.        return sequenceOf(1,2,3,4,5,6,7,8,9,10)

  19.                .map{ it * 2 }

  20.                .filter { it % 3  == 0 }

  21.                .map{ it+1 }

  22.                .sum()

  23.    }

  24.    @Benchmark

  25.    fun testList():Int {

  26.        return listOf(1,2,3,4,5,6,7,8,9,10)

  27.                .map{ it * 2 }

  28.                .filter { it % 3  == 0 }

  29.                .map{ it+1 }

  30.                .sum()

  31.    }

  32. }

  33. fun main() {

  34.    val options = OptionsBuilder()

  35.            .include(SequenceBenchmark::class.java.simpleName)

  36.            .output("benchmark_sequence.log")

  37.            .build()

  38.    Runner(options).run()

  39. }

在运行上述代码之前,需要先执行 ./gradlew build


  1. # Run complete. Total time: 00:05:23

  2. REMEMBER: The numbers below are just data. To gain reusable insights, you need to follow up on

  3. why the numbers are the way they are. Use profilers (see -prof, -lprof), design factorial

  4. experiments, perform baseline and negative tests that provide experimental control, make sure

  5. the benchmarking environment is safe on JVM/OS/HW level, ask for reviews from the domain experts.

  6. Do not assume the numbers tell you what you want them to tell.

  7. Benchmark                        Mode  Cnt      Score     Error   Units

  8. SequenceBenchmark.testList      thrpt   20  15924.272 ± 305.825  ops/ms

  9. SequenceBenchmark.testSequence  thrpt   20  23099.938 ± 515.524  ops/ms

果然,经过多次链式调用时 Sequence 比起 List 具有更高的效率。

如果把结果导出成json格式,还可以借助 jmh 相关的 gradle 插件生成可视化的报告。

  1. fun main() {

  2.    val options = OptionsBuilder()

  3.            .include(SequenceBenchmark::class.java.simpleName)

  4.            .resultFormat(ResultFormatType.JSON)

  5.            .result("benchmark_sequence.json")

  6.            .output("benchmark_sequence.log")

  7.            .build()

  8.    Runner(options).run()

  9. }


借助 gradle-jmh-report 生成如下的报告:


3.2 内联函数和非内联函数

Kotlin 的内联函数从编译器角度将函数的函数体复制到调用处实现内联,减少了使用高阶函数带来的隐性成本。


  1. @BenchmarkMode(Mode.Throughput) // 基准测试的模式,采用整体吞吐量的模式

  2. @Warmup(iterations = 3) // 预热次数

  3. @Measurement(iterations = 10, time = 5, timeUnit = TimeUnit.SECONDS) // 测试参数,iterations = 10 表示进行10轮测试

  4. @Threads(8) // 每个进程中的测试线程数

  5. @Fork(2)  // 进行 fork 的次数,表示 JMH 会 fork 出两个进程来进行测试

  6. @OutputTimeUnit(TimeUnit.MILLISECONDS) // 基准测试结果的时间类型

  7. open class InlineBenchmark {

  8.    fun nonInlined(block: () -> Unit) { // 不用内联的函数

  9.        block()

  10.    }

  11.    inline fun inlined(block: () -> Unit) { // 使用内联的函数

  12.        block()

  13.    }

  14.    @Benchmark

  15.    fun testNonInlined() {

  16.        nonInlined {

  17.            println("")

  18.        }

  19.    }

  20.    @Benchmark

  21.    fun testInlined() {

  22.        inlined {

  23.            println("")

  24.        }

  25.    }

  26. }


  1. # Run complete. Total time: 00:05:23

  2. REMEMBER: The numbers below are just data. To gain reusable insights, you need to follow up on

  3. why the numbers are the way they are. Use profilers (see -prof, -lprof), design factorial

  4. experiments, perform baseline and negative tests that provide experimental control, make sure

  5. the benchmarking environment is safe on JVM/OS/HW level, ask for reviews from the domain experts.

  6. Do not assume the numbers tell you what you want them to tell.

  7. Benchmark                        Mode  Cnt   Score   Error   Units

  8. InlineBenchmark.testInlined     thrpt   20  95.866 ± 4.085  ops/ms

  9. InlineBenchmark.testNonInlined  thrpt   20  92.736 ± 3.085  ops/ms



3.3 协程和RxJava

自从 Kotlin 有协程这个功能之后,经常会有人提起协程和RxJava的比对。

于是,我也尝试编写一个例子,此例子使用的 Kotlin 1.3.10 ,协程的版本1.0.1,RxJava 2.2.4

  1. @BenchmarkMode(Mode.Throughput) // 基准测试的模式,采用整体吞吐量的模式

  2. @Warmup(iterations = 3) // 预热次数

  3. @Measurement(iterations = 10, time = 5, timeUnit = TimeUnit.SECONDS) // 测试参数,iterations = 10 表示进行10轮测试

  4. @Threads(8) // 每个进程中的测试线程数

  5. @Fork(2)  // 进行 fork 的次数,表示 JMH 会 fork 出两个进程来进行测试

  6. @OutputTimeUnit(TimeUnit.MILLISECONDS) // 基准测试结果的时间类型

  7. @State(Scope.Thread) // 为每个线程独享

  8. open class CoroutinesBenchmark {

  9.    var counter1 = AtomicInteger()

  10.    var counter2 = AtomicInteger()

  11.    @Setup

  12.    fun prepare() {

  13.        counter1.set(0)

  14.        counter2.set(0)

  15.    }

  16.    fun calculate(counter:AtomicInteger): Double {

  17.        val result = ArrayList<Int>()

  18.        for (i in 0 until 10_000) {

  19.            result.add(counter.incrementAndGet())

  20.        }

  21.        return result.asSequence().filter { it % 3 ==0 }.map { it *2 + 1 }.average()

  22.    }

  23.    @Benchmark

  24.    fun testCoroutines() = runBlocking {

  25.        calculate(counter1)

  26.    }

  27.    @Benchmark

  28.    fun testRxJava() = Observable.fromCallable { calculate(counter2) }.blockingFirst()

  29. }


  1. # Run complete. Total time: 00:05:23

  2. REMEMBER: The numbers below are just data. To gain reusable insights, you need to follow up on

  3. why the numbers are the way they are. Use profilers (see -prof, -lprof), design factorial

  4. experiments, perform baseline and negative tests that provide experimental control, make sure

  5. the benchmarking environment is safe on JVM/OS/HW level, ask for reviews from the domain experts.

  6. Do not assume the numbers tell you what you want them to tell.

  7. Benchmark                            Mode  Cnt   Score   Error   Units

  8. CoroutinesBenchmark.testCoroutines  thrpt   20  17.719 ± 2.249  ops/ms

  9. CoroutinesBenchmark.testRxJava      thrpt   20  18.151 ± 0.429  ops/ms

此基准测试采用的是 Throughput 模式,得分越高则性能越好。从得分来看,两者差距不大。(对于两者的比较,我还没有做更多的测试。)



基准测试有很多典型的应用场景,例如想比较某些方法的执行时间,对比接口不同实现在相同条件下的吞吐量等等。在这些场景下,使用 JMH 都是很不错的选择。




这篇关于使用 JMH 做 Kotlin 的基准测试的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!




