本文主要是介绍setbit实现活跃用户统计,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
通过《The Little Redis Book》看到有这样一篇博文《REDIS BITMAPS – FAST, EASY, REALTIME METRICS》,这次就不翻译了,已经有其他中文的版本。写这个目的在于一开始没看懂,想把整个详细的思想写出来。
先看setbit的使用。https://redis.io/commands/setbit。
先说位图,bitmap,根据二进制不同位置的值即可表示其代表的值。这就让我想起了上过的数字图像处理了。
setbit(key,offset,value)
offset是从左往右算的位数,从零开始,即高位往低位的值,例如100011,offset为0的时候值为1, 4和5的值都为1。
本身redis存储字符串,以二进制格式存储。
所以文章里面的配图是错的。反过来了。
返回值是0和1,表示的是,设置前该offset位置下bit的值。
The offset argument is required to be greater than or equal to 0, and smaller than 2^32 (this limits bitmaps to 512MB)
bitmap本身offset的限制就是0到2^32,内存限制为521MB,分配所需时间才几百ms,刚刚好是2^32个bit,也就是4294967296,也就是说,offset最大能去到4294967296-1去。有四十二亿。
照着文章作者的思路。他们网站封顶有1亿多的用户。每个用户都有自己的用户ID。一个用户做操作,我们有个40多亿长度全为0的位图。
我们只需要在这个根据ID做位置定位(即offset偏移)将其改为1,就算记录了该用户的操作了。每个用户的id不一样,将日期作为key,然后根据用户id的唯一性作为offset偏移。需要保证用户id不会超过4294967296-1。
而要统计一天用多少用户做操作(为什么说操作不说登录了,因为不仅仅限于登录,浏览某某东西,写日记等等都可以用这种方法)
,除去重复,总数就是这个位图里面值为1的个数。
将文章的代码具体实现了一下。
Jedis j = new Jedis("localhost");
//auth password
j.auth("myredis");//2016-12-3 login operation user
j.setbit("login:2016-12-3".getBytes(), 1, true);
j.setbit("login:2016-12-3".getBytes(), 124431, true);
j.setbit("login:2016-12-3".getBytes(),1231, true);
j.setbit("login:2016-12-3".getBytes(), 323121, true);
BitSet b = BitSet.valueOf(j.get("login:2016-12-3".getBytes()));//the number of bit value 1
int lognum3 = b.cardinality();
System.out.println("2016-12-3 login user number: "+lognum3);//2016-12-3 login operation user
j.setbit("login:2016-12-4".getBytes(), 1, true);
j.setbit("login:2016-12-4".getBytes(), 1231231, true);
j.setbit("login:2016-12-4".getBytes(), 334441, true);
BitSet b2 = BitSet.valueOf(j.get("login:2016-12-4".getBytes()));int lognum4 = b2.cardinality();
System.out.println("2016-12-4 login user number: "+b2.cardinality());b.or(b2);
//or操作之后 同样userid的记录会重合不做记录,所以具体的数据统计看自己的需求而定
int lognumexceptsameuser = b.cardinality();
int logtotalnum = lognum3+lognum4;
System.out.println("2016-12-3 to 2016-12-4 login user number except same userid: "+lognumexceptsameuser);
System.out.println("2016-12-3 to 2016-12-4 login user number: "+logtotalnum);输出:2016-12-3 login user number: 4
2016-12-4 login user number: 3
2016-12-3 to 2016-12-4 login user number except same userid: 6
2016-12-3 to 2016-12-4 login user number: 7
如果用户数登录求和时,不同日期的用户ID登录需要计算,那么就不要做或操作,将每天的登录数求和即可。
如果求的是一个月内,用户登录总数,用户登录多次只算一次的话,只需要将这段时间内的bit进行或操作即可。
确实快,不需要你记录到数据库。只需要一个bit就能记录该用户登录。
利用了redis本身用内存存储的优势。这种需求下的解决方案确实是快,方便。
当然这种只针对这种特殊的需求,你非要每天用户重复登录的次数也算进去,当然就不能用这种方法。所以,针对不同的需求,找出最优方案才是最好的。
---------------------
转载自:https://blog.csdn.net/iaiti/article/details/53446667
这篇关于setbit实现活跃用户统计的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!