本文主要是介绍[Hive SQL] 实现分组排序、分组topN,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
举个场景例子 我们要计算app内在每小时区间内访问量前2的服务 根据访问日志处理完后的数据集如下所示
visit_hour | service_name | visit_cnt |
---|---|---|
2021062401 | A | 421 |
2021062401 | B | 710 |
2021062401 | C | 235 |
2021062401 | D | 839 |
2021062402 | A | 63 |
2021062402 | D | 5452 |
2021062402 | E | 152 |
代码如下:
select *
from
(select visit_hour, service_name, visit_cnt,
row_number() over (partition by visit_hour order by visit_cnt desc) as rank_no
from service_visit) a
where a.rank_no <= 2
order by visit_hour, visit_cnt;
(以上只是一个简单场景 其他的的周末补充
这篇关于[Hive SQL] 实现分组排序、分组topN的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!