Flume - 初用Flume 1.8.0

2024-06-14 21:48
文章标签 1.8 flume 初用

本文主要是介绍Flume - 初用Flume 1.8.0,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Flume - 初用Flume

在Flume中,最重要的三个部件分别为:

  1. source
  2. channels
  3. sink

在本例中我们使用如图的架构来进行Flume数据采集:

FlumeDemo.png-7.5kB

当前使用的flume版本号为1.8.0,如果相对其他类别的配置有更详细的了解,可查看:http://flume.apache.org/FlumeUserGuide.html

对于flume中的使用主要是对于配置文件的使用,本文所使用的的配置文件名为flume安装目录下的conf/flume-conf.properties


一、总体配置

agent.sources = dirSrc
agent.channels = memoryChannel
agent.sinks = kafkaSink

在这里面我们总共做了如下几个事情:

  1. 定义该flume应用的名称为agent
  2. 该应用的sources名称为dirSrc
  3. 该应用的channels名称为memoryChannel
  4. 该应用的sinks名称为kafkaSink

二、定义sources

我们使用的 sources 类型为Spooling Directory Source

其作用是:监听一个文件夹,收集文件夹下新文件数据,收集完新文件数据会将文件名称的后缀改为.COMPLETED,缺点是不支持老文件新增数据的收集,并且不能够对嵌套文件夹递归监听。

我们配置文件的内容为:

agent.sources.dirSrc.type = spooldir
agent.sources.dirSrc.spoolDir=/mnt/vdb/bigdata/flume/data
agent.sources.dirSrc.fileHeader=true 
agent.sources.dirSrc.channels = memoryChannel

关键参数说明:

  1. type:source类型为spooldir。
  2. spoolDir:source监听的文件夹。
  3. fileHeader:是否添加文件的绝对路径到event的header中,默认值false。
  4. fileHeaderKey:添加到event header中文件绝对路径的键值,默认值file。
  5. selector.type:选择器类型,默认replicating(可选值为replicat

这篇关于Flume - 初用Flume 1.8.0的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1061597

相关文章

source配置文件不生效 原创 2016年03月14日 18:43:55 3558 问题背景: 升级jdk 1.8之后,启动时报版本编译问题,查看$JAVA_HOME,$JRE_HOME

source配置文件不生效 原创  2016年03月14日 18:43:55 3558 问题背景:       升级jdk 1.8之后,启动时报版本编译问题,查看$JAVA_HOME,$JRE_HOME,没有问题。      初步推断是没有source,sourec .bashrc 之后查看$JAVA_HOME,$JRE_HOME变成1.8版本,但启动时还是报错,这就

不到3毛钱的SOT23和SOT89封装18V耐压低功耗高PSRR高精度LDO稳压芯片ME6231电流0.5A电压3.3V和1.8V

前言 SOT23-5封装ME6231外观和丝印 一款国产LDO,某些场合,要把1117扔了吧,SOT23封装,虽然不是最小,但也是够小的了。 参考价格:约0.25元 概述 ME6231 系列是以 CMOS 工艺制造的 18V 耐压、低功耗、高 PSRR,高精度低压差线性稳压器。ME6231系列稳压器内置固定电压基准,温度保护,限流电路,相位补偿电路以及低内阻的 MOSFET,达到高

Python CSV初用

import csvf_w = csv.writer(open('ret.csv','wb'))f_w.writerow([t1,t2,uid,t4,last_date,reg_date]) 我使用的是 生成CSV文件的功能。 首先 import csv  模块 既然是生成文件 ,先用open()打开一个文件 。 就是这一句 f_w = csv.writer(open(

Ubuntu 16.04 安装 JDK 1.8

1、首先从oracle下载jdk 1.8,我下载的版本是jdk-8u131-linux-x64.tar.gz, 运行tar zvxf jdk-8u131-linux-x64.tar.gz解压获得文件夹jdk1.8.0_131。 2、在usr目录下创建jvm目录 sudo mkdir /usr/jvm 3、然后将解压缩后的jdk1.8.0_131剪切到/usr/jvm目录下 su

druid-spring-boot-stater-1.2.6+maven3.8.2 -> Cannot resolve com.sun:tools:1.8

druid-spring-boot-stater-1.2.6+maven3.8.2 -> Cannot resolve com.sun:tools:1.8 问题描述问题重现问题解决问题原因 问题描述 druid-spring-boot-stater-1.2.6+maven3.8.2 会导致编译时出现 Cannot resolve com.sun:tools:1.8报错 问题重现

《书生·浦语大模型实战营》第4课 学习笔记:XTuner 微调 LLM:1.8B、多模态、Agent

文章大纲 1. 大模型微调简介2 快速上手2.1 环境安装2.2 前期准备2.2.1 数据集准备2.2.2 模型准备2.2.3 配置文件选择2.2.4 小结 2.3 配置文件修改2.4 模型训练2.4.1 常规训练2.4.2 使用 deepspeed 来加速训练2.4.3 训练结果2.4.4 小结 2.5 模型转换、整合、测试及部署2.5.1 模型转换2.5.2 模型整合2.5.3 对话测试

Spark Streaming(三)—— 高级数据源Flume

文章目录 高级数据源Flume1. Push方式2. 基于Custom Sink的Pull模式 高级数据源Flume Spark Streaming 是一个流式计算引擎,就需要对接外部数据源来对接、接收数据。每一个输入流DStream和一个Receiver对象相关联,这个Receiver从源中获取数据,并将数据存入内存中用于处理。Spark Streaming的基本数据源(文件

java基础 浅解1.8新增lambda表达式

lambda是java1.8的一个新特性,可以简化一些代码 lambda 表达式的语法格式如下: (parameters) -> expression或(parameters) ->{ statements; } 理解lambda之前我们首先应该理解一个什么叫做函数式接口。 函数式接口 : 任何接口,如果只包含唯一一个抽象方法,那么就是一个函数式接口。 public inter

【Hadoop】Flume NG Getting Started(Flume NG 新手入门指南)翻译

新手入门 Flume NG是什么? 有什么改变? 获得Flume NG 从源码构建 配置 flume-ng全局选项flume-ng agent选项flume-ng avro-client 选项 提供反馈 Flume NG是什么? Flume NG的目标是比Flume OG在简单性,大小和容易部署上有显著性地提高。为了实现这个目标,Flume NG将不会兼容Flume OG.我们目

【Hadoop】Flume官方文档翻译——Flume 1.7.0 User Guide (unreleased version)中一些知识点

Flume官方文档翻译——Flume 1.7.0 User Guide (unreleased version)(一) Flume官方文档翻译——Flume 1.7.0 User Guide (unreleased version)(二) Flume Properties Property Name Default  Description flume.called