Flume java.lang.NoSuchMethodError: org.apache.hadoop.hbase.client.Put.setWriteToWAL

本文主要是介绍Flume java.lang.NoSuchMethodError: org.apache.hadoop.hbase.client.Put.setWriteToWAL,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

之前我们的架构方式采用的是spark+hbase+oozie解析存储及调用算法模式,最近突然出现一个需求,会有很多小文件上传,而且要求达到伪实时处理,也就是秒级别,spark很显然不适合解析了,哪怕是几十行的文件, spark也基本是分钟级别。

我想过2个方案来处理,一个是使用纯JAVA来解析文件,另外一个就是使用flume来解析并直接存储到HBASE。

下载最新版本Flume1.8,通过spoolDir方式,配置文件如下:

a1.sources =  r1
a1.sinks =  k1
a1.channels  = c1a1.sources.r1.type = spooldir
a1.sources.r1.spoolDir = /data/flume/r1/data
a1.sources.r1.batchSize = 100
a1.sources.r1.channels = c1a1.channels.c1.type=file
a1.channels.c1.write-timeout=10
a1.channels.c1.keep-alive=10
a1.channels.c1.checkpointDir=/data/flume/c1/checkpoint
a1.channels.c1.dataDirs=/data/flume/c1/data
a1.channels.c1.maxFileSize= 268435456#a1.sinks.k1.type = logger
a1.sinks.k1.type = hbase
a1.sinks.k1.table = flume
a1.sinks.k1.columnFamily = cf
#a1.sinks.k1.serializer = org.apache.flume.sink.hbase.SimpleAsyncHbaseEventSerializer
a1.sinks.k1.serializer = org.apache.flume.sink.hbase.RegexHbaseEventSerializer
a1.sinks.k1.batchSize = 100
a1.sinks.k1.serializer.regex = (.*?)\\|\\|(.*?)\\|\\|(.*?)\\|\\|(.*?)\\|\\|(.*)
a1.sinks.k1.serializer.colNames = ROW_KEY,cnc_rdspmeter[0],cnc_rdsvmeter,cnc_statinfo[3],ext_toolno
a1.sinks.k1.serializer.regexIgnoreCase = true
a1.sinks.k1.serializer.depositHeaders = true
a1.sinks.hbaseSink.zookeeperQuorum = datanode01-ucloud.isesol.com:2181
a1.sinks.k1.channel = c1
然后启动flume:   
bin/flume-ng agent -n a1 -c conf -f conf/flume-conf.properties 

在消费文件的时候错误如下:

Exception in thread "SinkRunner-PollingRunner-DefaultSinkProcessor" java.lang.NoSuchMethodError: org.apache.hadoop.hbase.client.Put.setWriteToWAL(Z)Lorg/apache/hadoop/hbase/client/Put;at org.apache.flume.sink.hbase.HBaseSink$3.run(HBaseSink.java:380)at org.apache.flume.sink.hbase.HBaseSink$3.run(HBaseSink.java:375)at org.apache.flume.auth.SimpleAuthenticator.execute(SimpleAuthenticator.java:50)at org.apache.flume.sink.hbase.HBaseSink.putEventsAndCommit(HBaseSink.java:375)at org.apache.flume.sink.hbase.HBaseSink.process(HBaseSink.java:345)at org.apache.flume.sink.DefaultSinkProcessor.process(DefaultSinkProcessor.java:67)at org.apache.flume.SinkRunner$PollingRunner.run(SinkRunner.java:145)at java.lang.Thread.run(Thread.java:748)
^CAttempting to shutdown background worker.

setWriteWal在之前版本存在,但是1.0之后应该就没有了,我不知道为什么Flume的开发者在最新的1.8仍然在使用这个方法,很无奈,查询了一下网上,基本没什么解决方案,于是打开源代码,看看究竟怎么回事。

因为我使用的是type是hbase,因此找到hbaseSink.java, 通过find查找哪里有setWriteWAL, 发现有3个地方存在,

      public Void run() throws Exception {for (Row r : actions) {if (r instanceof Put) {// ((Put) r).setWriteToWAL(enableWal);}// Newer versions of HBase - Increment implements Row.if (r instanceof Increment) {//  ((Increment) r).setWriteToWAL(enableWal);}}table.batch(actions);return null;}
      public Void run() throws Exception {List<Increment> processedIncrements;if (batchIncrements) {processedIncrements = coalesceIncrements(incs);} else {processedIncrements = incs;}// Only used for unit testing.if (debugIncrCallback != null) {debugIncrCallback.onAfterCoalesce(processedIncrements);}for (final Increment i : processedIncrements) {//  i.setWriteToWAL(enableWal);table.increment(i);}return null;}});

上面3个被我注视掉的地方,就是setWriteWAL, 这个东西实际无所谓,因此我很暴力的直接注释,然后再重新打一个包进行替换,官方名字叫:flume-ng-hbase-sink-1.8.0.jar。重新启动Flume,查看结果:

hbase(main):001:0> scan 'flume'
ROW                                        COLUMN+CELL                                                                                                                 1529992556110-SzjikLv1LH-0                column=cf:ROW_KEY, timestamp=1529992556407, value=cnc_exeprgname:418                                                        1529992556110-SzjikLv1LH-0                column=cf:cnc_rdspmeter[0], timestamp=1529992556407, value=cnc_rdspmeter[0]:0                                               1529992556110-SzjikLv1LH-0                column=cf:cnc_rdsvmeter, timestamp=1529992556407, value=cnc_rdsvmeter:6,7,92,0                                              1529992556110-SzjikLv1LH-0                column=cf:cnc_statinfo[3], timestamp=1529992556407, value=cnc_statinfo[3]:3                                                 1529992556110-SzjikLv1LH-0                column=cf:ext_toolno, timestamp=1529992556407, value=ext_toolno:30                                                          1529992556125-SzjikLv1LH-1                column=cf:ROW_KEY, timestamp=1529992556407, value=cnc_exeprgname:418                                                        1529992556125-SzjikLv1LH-1                column=cf:cnc_rdspmeter[0], timestamp=1529992556407, value=cnc_rdspmeter[0]:0                                               1529992556125-SzjikLv1LH-1                column=cf:cnc_rdsvmeter, timestamp=1529992556407, value=cnc_rdsvmeter:6,7,93,0                                              1529992556125-SzjikLv1LH-1                column=cf:cnc_statinfo[3], timestamp=1529992556407, value=cnc_statinfo[3]:3                                                 1529992556125-SzjikLv1LH-1                column=cf:ext_toolno, timestamp=1529992556407, value=ext_toolno:30                                                          1529992556126-SzjikLv1LH-2                column=cf:ROW_KEY, timestamp=1529992556407, value=cnc_exeprgname:418                                                        1529992556126-SzjikLv1LH-2                column=cf:cnc_rdspmeter[0], timestamp=1529992556407, value=cnc_rdspmeter[0]:0                                               1529992556126-SzjikLv1LH-2                column=cf:cnc_rdsvmeter, timestamp=1529992556407, value=cnc_rdsvmeter:5,10,93,0                                             1529992556126-SzjikLv1LH-2                column=cf:cnc_statinfo[3], timestamp=1529992556407, value=cnc_statinfo[3]:3                                                 1529992556126-SzjikLv1LH-2                column=cf:ext_toolno, timestamp=1529992556407, value=ext_toolno:30                                                          1529992556127-SzjikLv1LH-3                column=cf:ROW_KEY, timestamp=1529992556407, value=cnc_exeprgname:418                                                        1529992556127-SzjikLv1LH-3                column=cf:cnc_rdspmeter[0], timestamp=1529992556407, value=cnc_rdspmeter[0]:0                                               1529992556127-SzjikLv1LH-3                column=cf:cnc_rdsvmeter, timestamp=1529992556407, value=cnc_rdsvmeter:7,8,93,0                                              1529992556127-SzjikLv1LH-3                column=cf:cnc_statinfo[3], timestamp=1529992556407, value=cnc_statinfo[3]:3                                                 1529992556127-SzjikLv1LH-3                column=cf:ext_toolno, timestamp=1529992556407, value=ext_toolno:30                                                          1529992556128-SzjikLv1LH-4                column=cf:ROW_KEY, timestamp=1529992556407, value=cnc_exeprgname:418                                                        1529992556128-SzjikLv1LH-4                column=cf:cnc_rdspmeter[0], timestamp=1529992556407, value=cnc_rdspmeter[0]:0                                               1529992556128-SzjikLv1LH-4                column=cf:cnc_rdsvmeter, timestamp=1529992556407, value=cnc_r
世界终于清静了。 这个ROWKEY的设置不符合我的需求,还需要修改源代码。


这篇关于Flume java.lang.NoSuchMethodError: org.apache.hadoop.hbase.client.Put.setWriteToWAL的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/909603

相关文章

JVM 的类初始化机制

前言 当你在 Java 程序中new对象时,有没有考虑过 JVM 是如何把静态的字节码(byte code)转化为运行时对象的呢,这个问题看似简单,但清楚的同学相信也不会太多,这篇文章首先介绍 JVM 类初始化的机制,然后给出几个易出错的实例来分析,帮助大家更好理解这个知识点。 JVM 将字节码转化为运行时对象分为三个阶段,分别是:loading 、Linking、initialization

Spring Security 基于表达式的权限控制

前言 spring security 3.0已经可以使用spring el表达式来控制授权,允许在表达式中使用复杂的布尔逻辑来控制访问的权限。 常见的表达式 Spring Security可用表达式对象的基类是SecurityExpressionRoot。 表达式描述hasRole([role])用户拥有制定的角色时返回true (Spring security默认会带有ROLE_前缀),去

浅析Spring Security认证过程

类图 为了方便理解Spring Security认证流程,特意画了如下的类图,包含相关的核心认证类 概述 核心验证器 AuthenticationManager 该对象提供了认证方法的入口,接收一个Authentiaton对象作为参数; public interface AuthenticationManager {Authentication authenticate(Authenti

Spring Security--Architecture Overview

1 核心组件 这一节主要介绍一些在Spring Security中常见且核心的Java类,它们之间的依赖,构建起了整个框架。想要理解整个架构,最起码得对这些类眼熟。 1.1 SecurityContextHolder SecurityContextHolder用于存储安全上下文(security context)的信息。当前操作的用户是谁,该用户是否已经被认证,他拥有哪些角色权限…这些都被保

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

hadoop开启回收站配置

开启回收站功能,可以将删除的文件在不超时的情况下,恢复原数据,起到防止误删除、备份等作用。 开启回收站功能参数说明 (1)默认值fs.trash.interval = 0,0表示禁用回收站;其他值表示设置文件的存活时间。 (2)默认值fs.trash.checkpoint.interval = 0,检查回收站的间隔时间。如果该值为0,则该值设置和fs.trash.interval的参数值相等。