本文主要是介绍(40)首单分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1.需求分析及实现思路
按省份|用户性别|用户年龄段,统计当日新增付费用户首单平均消费及人数占比
无论是省份名称、用户性别、用户年龄,订单表中都没有这些字段,需要订单(事实表)
和维度表(省份、用户)进行关联,形成宽表后将数据写入到 ES,通过 Kibana 进行分析
以及图形展示。
2 . 整体实时计算框架流程
1.3 具体业务流程图
1.4 实现思路
1.4.1 功能 1:数据采集
从 MySQL 数据库中采集业务数据到 Kafka,并对数据进行分流处理(ODS 层),分
流数据处理之后,将数据写回 Kafka。我们这里使用 canal 和 Maxwell 两种方式实现
1.4.2 功能 2:判断是否为首单用户
每笔订单都要判断是否是该用户的首单
判断是否首单的要点,在于该用户之前是否参与过消费(下单)。那么如何知道用户之
前是否参与过消费,如果临时从所有消费记录中查询,是非常不现实的。那么只有将“用户
是否消费过”这个状态进行保存并长期维护起来。在有需要的时候通过用户 id 进行关联查
询。
在实际生产中,这种用户状态是非常常见的比如“用户是否退过单”、“用户是否投过
诉”、“用户是否是高净值用户”等等。我们要想保存状态,大家可能会想到在 Redis 中
保存,Reids 可以实现,但是这个状态可能包含历史数据,数据量比较大,而且历史数据保
存在内存中,对内存压力也比较大。所以考虑到
1、 这是一个保存周期较长的数据。
2、 必须可修改状态值。
3、 查询模式基本上是 k-v 模式的查询。
所以综上这三点比较,状态适合保存在 Hbase 中。
1.4.3 功能 3:订单与维度表的关联
在查询订单的时候,订单与 Hbase 中省份和用户的维度表进行关联,才能获取省份名
称、用户性别、用户年龄等对应字段,完成后面的统计。
1.4.4 功能 4:可视化展示
将订单关联后的宽表保存到 ES,利用 Kibana 进行分析展示
这篇关于(40)首单分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!