本文主要是介绍Spark(43) -- SparkStreaming -- 案例:统计一定时间内的热门词汇TopN,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1. 需求
模拟百度热搜排行榜
统计最近10s的热搜词Top3,每隔5秒计算一次
WindowDuration = 10s
SlideDuration = 5s
2. scala代码
import org.apache.spark.rdd.RDD
import org.apache.spark.streaming.dstream.{
这篇关于Spark(43) -- SparkStreaming -- 案例:统计一定时间内的热门词汇TopN的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!