本文主要是介绍48.判断是否为首单用户实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
4.1 准备工作
4.1.1 使用 phoenix 在 hbase 中建表
(1)解压 squirrel-sql-3.9.1.zip
(2)在解压后的目录双击运行 squirrel-sql.bat
(3)添加 phoenix 驱动
(4)具体驱动配置如下
◼
Example URL
jdbc:phoenix:hadoop202,hadoop203,hadoop204:2181
◼
Class Name
org.apache.phoenix.jdbc.PhoenixDriver
(5)创建连接
提前启动好 hdfs 以及 hbase
(6)连接后,查看数据库对象
(7)执行 SQL 语句
(8)调整字体大小
(9)执行建表以语句
create table user_status2020( user_id varchar primary key ,state.if_consumed
varchar ) SALT_BUCKETS = 3
4.1.2 在 pom.xml 文件中加入相关依赖
4.1.3 创建样例类
(1)创建 OrderInfo 样例类
(2)创建 UserStatus 样例类
4.1.4 创建 phoenix 查询工具类 PhoenixUtil
4.2 读取订单信息,查询用户状态(判断是否首单)
4.2.1 创建业务类 OrderInfoApp,读取订单、维护用户状
态代码
4.2.2 测试
◼
启动 ZK、Kafka、Redis、Maxwell、HDFS、Hbase
◼
运行 BaseDBMaxwellApp、OrderInfoApp
◼
修改模拟生成数据日期、运行模拟生成日志的 jar 包
◼
OrderInfoApp 输出结果
4.3
维护用户状态
将用户是否消费的状态保存到 Hbase 中
4.3.1 在 OrderInfoApp 中继续完成代码
4.3.2 测试
◼
启动 ZK、Kafka、Redis、Maxwell、HDFS、Hbase
◼
运行 BaseDBMaxwellApp、OrderInfoApp
◼
修改模拟生成数据日期、运行模拟生成日志的 jar 包
◼
Hbase 输出结果
4.4
一个采集周期状态修正
➢
漏洞
如果一个用户是首次消费,在一个采集周期中,这个用户下单了 2 次,那么就会
把这同一个用户都会统计为首单消费
➢
解决办法
应该将同一采集周期的同一用户的最早的订单标记为首单,其它都改为非首单
◼
同一采集周期的同一用户-----按用户分组(groupByKey)
◼
最早的订单-----排序,取最早(sortwith)
这篇关于48.判断是否为首单用户实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!