本文主要是介绍【HBZ分享】Kafka为什么性能非常高,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Kafka性能高的原因
-
磁盘顺序读写:磁盘顺序读写的性能可以和内存相媲美,顺序读写不需要寻道时间,也不需要大幅旋转磁头找扇区,所以性能极高
-
零拷贝: 大幅降低了用户态与内核态之间的切换,从而减少了数据来回复制。
-
批量发送:kafka有一个buffer池来存储消息,当累积到一定大小 或者 达到了指定发送时间间隔,会一起把buffer中所有消息一起发送,避免一条条发送。
-
压缩技术:会压缩消息,使其体积变小,减少网络传输的耗时
-
分段保存消息数据以及索引:kafka采用分段保存消息数据以及对应索引。分段保存,第一:好处就是每一段的日志量相对较小,避免了日志文件过大。第二: 多个段的消息日志,只有最后一段具备写的能力,其余分段日志只是用来查询的。第三:每个分段都由偏移量索引和时间戳索引组成的,偏移量和 时间戳索引是由稀疏索引构造的,每个分段都会有一个基准偏移量来表示当前日志分段中第一条消息的offset, 第四: 查询指定时间戳或偏移量使用的【二分查找】,所以性能非常可观。
-
分区(partition): 一个topic主题有多个分区,这些分区可以分布在不同的broker,也就是说一个主题的消息可以有多个broker来进行消费负载均衡。
这篇关于【HBZ分享】Kafka为什么性能非常高的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!