本文主要是介绍rank,dense_rank,row_number,ntile区别和用法。,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
背景,忙完了。终于不用再赶了,自己在做项目中遇到的和当时迷惑的某些点,记录了一下,现在来做一个总结。
RANK() 排序相同时会重复,总数不会变。
DENSE_RANK()排序相同时会重复,总数会减少。 (dense:稠密的意思)
1建表
create table product_sell (
big_class string,
small_class string,
money double
) partitioned by (da string)
2插入数据
insert into product_sell partition (da=“201907”)
values
(“彩电”, “L55E5800A-UD”, 80),
(“彩电”, “L55V6500A-3D”, 90),
(“彩电”, “LSC550FN11-C”, 100),
(“冰箱”, “BCD-520WBEPF2”, 80),
(“冰箱”, “BCD-435WBEPIZ50”, 90),
(“冰箱”, “BCD-202U16”, 100),
(“空调”, “KFRd-35G/E012BpA”, 90),
(“空调”, “KFRd-26GW/DBp-XP21”, 100),
(“空调”, “KFR-35W/S13”, 100);
3.测试
3.1 RANK
查询本月个品类各型号销售额
select *, rank() over (partition by big_class order by money desc) from product_sell where da=“201907”;
分析看看:空调先并列第一,但没有第二直接到第三了。这个排序不太符合平常的查看习惯。如果出现并列最好后面的提到前面就好,这时就可以用dense_rank()
3.2dense_rank()
dense,意思是稠密的,而rank()生成的排名序列中可能有空隙(可能是不连续的)。dense_rank()则是排序稠密的连续的
3.3row_number()
需求改了,
- 首先按照销售额排序
- 销售额相同的不要并列,而是再小品类排序
3.4 nticle :切片后的属于哪个切片的值
4.总结
ntile/rank / dense_rank / row_number的语法都是一样的,都可以进行排序,不同的只是几个特性:
ntile :指的是将数据分几份,返回的份序列号。
- rank / dense_rank都考虑了并列的情况,所以序号可能不唯一,rank在出现并列之后会不连续,而dense_rank是连续的
- row_number不考虑并列的情况,所以序号是唯一的,并且也不会出现不连续。因此利用这个特性在给表去重和选择主键是可以用此种方法。这个在下面的文章中做介绍。
这篇关于rank,dense_rank,row_number,ntile区别和用法。的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!