Flume入门案例之NetCat-Souces

2023-11-22 02:48

本文主要是介绍Flume入门案例之NetCat-Souces,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

大家好,我是邵奈一,一个不务正业的程序猿、正儿八经的斜杠青年。
1、世人称我为:被代码耽误的诗人、没天赋的书法家、五音不全的歌手、专业跑龙套演员、不合格的运动员…
2、这几年,我整理了很多IT技术相关的教程给大家,爱生活、爱分享。
3、如果您觉得文章有用,请收藏,转发,评论,并关注我,谢谢!
博客导航跳转(请收藏):邵奈一的技术博客导航
| 公众号 | 微信 | CSDN | 掘金 | 51CTO | 简书 | 微博 |


教程目录

  • 0x00 教程内容
  • 0x01 Flume的使用
          • 1. 编写配置文件
          • 2. 安装telnet
          • 3. 校验结果
  • 0x02 简单讲解
          • 1. 流程讲解
          • 2. 组件讲解
          • 3. 其他讲解
  • 0xFF 总结

0x00 教程内容

  1. Flume的使用
  2. 简单讲解

安装Flume,请参考教程:
D009 复制粘贴玩大数据之安装与配置Flume集群
非常简单,一解压就行了!

0x01 Flume的使用

1. 编写配置文件

a. 编写配置文件
cd ~/bigdata/apache-flume-1.8.0-bin

vi conf/example.conf

在这里插入图片描述

a1.sources = r1
a1.sinks = k1
a1.channels = c1a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444a1.sinks.k1.type = logger
a1.channels.c1.type = memorya1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
2. 安装telnet

a. 上传相关rpm包到master
在这里插入图片描述
b. 安装rpm包(按顺序安装)

sudo rpm -ivh xinetd-2.3.14-39.el6_4.x86_64.rpm
sudo rpm -ivh telnet-0.17-47.el6.x86_64.rpm
sudo rpm -ivh telnet-server-0.17-47.el6.x86_64.rpm

在这里插入图片描述
c. 查看状态:
rpm -q telnet
rpm -q telnet-server
在这里插入图片描述
d. 配置Telnet,修改服务disable为no
sudo vi /etc/xinetd.d/telnet
e. 重启服务(telnet服务是由xinetd守护的)
service xinetd restart
在这里插入图片描述

3. 校验结果

a. 在终端1启动(处于待输入状态)

bin/flume-ng agent --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/example.conf --name a1 -Dflume.root.logger=INFO,console

在这里插入图片描述
b. 打开另一终端2

telnet localhost 44444

在这里插入图片描述
然后随便输入内容:
I am shaonaiyi.
在这里插入图片描述
c. 切换回终端1,可以看到我们的结果:
在这里插入图片描述

0x02 简单讲解

1. 流程讲解

a. 其实学习Flume,就是在学习如何配置,需要多看一下官网,版本不同,配置也会有所区别,如果操作不成功,很可能是配置文件写错了。

b. 配置文件主要有四部分:
source、channel、sink,还有将组件连接起来

2. 组件讲解

a. Source
此处是netcat类型,官网其实还有netcatudp

b. Channel
此处是memory类型

c. Sink
此处是输出到控制台

3. 其他讲解

a. 输出日志的方式
执行时添加下面这个参数,是指定输入信息到控制台,如果不加,会默认将日志输入到logs文件夹:
-Dflume.root.logger=INFO,console

b. 配置文件注意事项
这里可以使用多节点操作,比如说在slave1中启动flume,在master上执行telnet也可以。

但有个点需要特别注意:
如果Flume配置文件里绑定的主机是localhost,即本地主机:
a1.sources.r1.bind = localhost
则无法进行多节点操作,如果想要多节点,应该将配置文件的localhost,修改成ip或者配置了映射关系的主机名。

否则在使用telnet 192.168.128.132 44444的时候,会报错:

Trying 192.168.128.132...
telnet: connect to address 192.168.128.132: Connection refused

举例:想在master发送信息,然后让slave1接收,则master可以执行:
telnet 192.168.128.132 44444
或者
telnet slave1 44444
slave1则相对于地应该是:
a1.sources.r1.bind = 192.168.128.132
或者
a1.sources.r1.bind = slave1

过程截图:
在这里插入图片描述
slave1也可以收到信息:
在这里插入图片描述

0xFF 总结

  1. 自行了解event的结构
  2. 安装好后,就可以与Kafka、HDFS等结合操作了
  3. 其实,如果你配置好了JAVA_HOME等环境变量,flume直接解压就可以使用了,即不修改配置文件(flume-env.sh.template)也是可以的。如果到目前为止,flume其实就只是写了个配置文件而已,如果发现自己在操作的时候错了,极大一个可能就是配置文件写错了,回去看看配置文件有什么问题。

邵奈一 原创不易,如转载请标明出处,教育是一生的事业。


这篇关于Flume入门案例之NetCat-Souces的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/406932

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

数论入门整理(updating)

一、gcd lcm 基础中的基础,一般用来处理计算第一步什么的,分数化简之类。 LL gcd(LL a, LL b) { return b ? gcd(b, a % b) : a; } <pre name="code" class="cpp">LL lcm(LL a, LL b){LL c = gcd(a, b);return a / c * b;} 例题:

客户案例:安全海外中继助力知名家电企业化解海外通邮困境

1、客户背景 广东格兰仕集团有限公司(以下简称“格兰仕”),成立于1978年,是中国家电行业的领军企业之一。作为全球最大的微波炉生产基地,格兰仕拥有多项国际领先的家电制造技术,连续多年位列中国家电出口前列。格兰仕不仅注重业务的全球拓展,更重视业务流程的高效与顺畅,以确保在国际舞台上的竞争力。 2、需求痛点 随着格兰仕全球化战略的深入实施,其海外业务快速增长,电子邮件成为了关键的沟通工具。

Java 创建图形用户界面(GUI)入门指南(Swing库 JFrame 类)概述

概述 基本概念 Java Swing 的架构 Java Swing 是一个为 Java 设计的 GUI 工具包,是 JAVA 基础类的一部分,基于 Java AWT 构建,提供了一系列轻量级、可定制的图形用户界面(GUI)组件。 与 AWT 相比,Swing 提供了许多比 AWT 更好的屏幕显示元素,更加灵活和可定制,具有更好的跨平台性能。 组件和容器 Java Swing 提供了许多

【IPV6从入门到起飞】5-1 IPV6+Home Assistant(搭建基本环境)

【IPV6从入门到起飞】5-1 IPV6+Home Assistant #搭建基本环境 1 背景2 docker下载 hass3 创建容器4 浏览器访问 hass5 手机APP远程访问hass6 更多玩法 1 背景 既然电脑可以IPV6入站,手机流量可以访问IPV6网络的服务,为什么不在电脑搭建Home Assistant(hass),来控制你的设备呢?@智能家居 @万物互联

poj 2104 and hdu 2665 划分树模板入门题

题意: 给一个数组n(1e5)个数,给一个范围(fr, to, k),求这个范围中第k大的数。 解析: 划分树入门。 bing神的模板。 坑爹的地方是把-l 看成了-1........ 一直re。 代码: poj 2104: #include <iostream>#include <cstdio>#include <cstdlib>#include <al