Hadoop 生态圈 ————ZooKeeper组件

2024-03-04 13:30

本文主要是介绍Hadoop 生态圈 ————ZooKeeper组件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ZooKeeper是一个开源的分布式应用程序协调服务,是Google的Chubby一个开源的实现,它是集群的管理者,监视着集群中各个节点的状态,根据节点提交的反馈进行下一步合理操作。最终,将简单易用的接口、性能高效和功能稳定的系统提供给用户。

ZooKeeper的核心是原子广播,这个机制保证了各个Server之间的同步。实现这个机制的协议叫做Zab协议。Zab协议有两种模式,它们分别是恢复模式(选主)和广播模式(同步)。当服务启动或者在领导者崩溃后,Zab就进入了恢复模式,当领导者被选举出来,且大多数Server完成了和leader的状态同步以后,恢复模式就结束了。状态同步保证了leader和Server具有相同的系统状态。

ZooKeeper安装模式分为:单机模式安装、伪分布式安装和集群模式安装。

Zookeeper的特点:

(1)最终一致性:为客户端展示同一视图,这是ZooKeeper最重要的功能。

(2)可靠性:如果消息被一台服务器接受,那么它将被所有的服务器接受。

(3)实时性:ZooKeeper不能保证两个客户端能同时得到刚更新的数据,如果需要最新数据,应该在读数据之前调用sync()接口。

(4)等待无关(wait-free):慢的或者失效的client不干预快速的client的请求。

(5)原子性:更新只能成功或者失败,没有中间状态。

(6)顺序性:所有Server,同一消息发布顺序一致。

用到ZooKeeper的系统:

(1)HDFS中的HA方案。

(2)YARN的HA方案。

(3)Hbase:必须依赖ZooKeeper,保存了Regionserver的心跳信息,和其他的一些关键信息。

(4)Flume:负载均衡,单点故障。

ZooKeeper的基本架构如下图所示:

(1)每个Server在内存中存储了一份数据。

(2)Zookeeper启动时,将从实例中选举一个leader(Paxos协议)。

(3)Leader负责处理数据更新等操作(Zab协议)。

(4)一个更新操作成功,当且仅当大多数Server在内存中成功修改数据。

Zookpeeper Server节点的数目一般为奇数,Leader选举算法采用了Paxos协议;Paxos核心思想:当多数Server写成功,则任务数据写成功。也就是说:如果有3个Server,则两个写成功即可,如果有4或5个Server,则三个写成功即可,Server数目一般为奇数(3、5、7...),如果有3个Server,则最多允许1个Server挂掉。

       ZooKeeper主要负责Hadoop集群的一些数据管理问题,如:命名服务、配置管理、状态同步、集群管理、队列管理、分布式锁等。

       ZooKeeper类似于文件系统+监测通知,它维护了一个类似文件系统的树形数据结构ZNode,ZNode节点下可以添加子节点或存储数据。

       ZooKeeper集群是分布式的、一致性的集群,具有容错性、可扩展、高性能等优点,可以配置多个Server节点,官方推荐部署奇数个(2n+1个),集群只要有半数以上(n+1个)的Server节点存活就可以正常对外提供服务。

       ZooKeeper采用写任意的方式,即对数据的修改可以提交给任意一个Server节点,而数据的读取是并行的,节点越多吞吐和响应能力越高。

       ZooKeeper各个Server之间的数据同步依靠Zab协议,Zab协议有两种模式:恢复模式(选举)和广播模式(同步)。当ZooKeeper重启或者Leader节点荡掉后,Zab就进入恢复模式,当Leader选举成功且大多数Server完成了和Leader的状态同步后,Zab就进入广播模式。

       ZooKeeper各个Server之间的选举通过Paxos算法。当Leader崩溃或者Leader失去大多数Follower时,ZooKeeper进入恢复模式重新选举Leader,如果某个Server获得半数以上的票数即成为新的Leader,ZooKeeper进入广播模式并同步数据状态,集群重新对外提供服务。

                                                                                                     郑州新思齐科技有限公司

                                                                                                                 王亚辉

这篇关于Hadoop 生态圈 ————ZooKeeper组件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/773316

相关文章

四种Flutter子页面向父组件传递数据的方法介绍

《四种Flutter子页面向父组件传递数据的方法介绍》在Flutter中,如果父组件需要调用子组件的方法,可以通过常用的四种方式实现,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录方法 1:使用 GlobalKey 和 State 调用子组件方法方法 2:通过回调函数(Callb

Vue项目中Element UI组件未注册的问题原因及解决方法

《Vue项目中ElementUI组件未注册的问题原因及解决方法》在Vue项目中使用ElementUI组件库时,开发者可能会遇到一些常见问题,例如组件未正确注册导致的警告或错误,本文将详细探讨这些问题... 目录引言一、问题背景1.1 错误信息分析1.2 问题原因二、解决方法2.1 全局引入 Element

vue解决子组件样式覆盖问题scoped deep

《vue解决子组件样式覆盖问题scopeddeep》文章主要介绍了在Vue项目中处理全局样式和局部样式的方法,包括使用scoped属性和深度选择器(/deep/)来覆盖子组件的样式,作者建议所有组件... 目录前言scoped分析deep分析使用总结所有组件必须加scoped父组件覆盖子组件使用deep前言

基于Qt Qml实现时间轴组件

《基于QtQml实现时间轴组件》时间轴组件是现代用户界面中常见的元素,用于按时间顺序展示事件,本文主要为大家详细介绍了如何使用Qml实现一个简单的时间轴组件,需要的可以参考下... 目录写在前面效果图组件概述实现细节1. 组件结构2. 属性定义3. 数据模型4. 事件项的添加和排序5. 事件项的渲染如何使用

JS常用组件收集

收集了一些平时遇到的前端比较优秀的组件,方便以后开发的时候查找!!! 函数工具: Lodash 页面固定: stickUp、jQuery.Pin 轮播: unslider、swiper 开关: switch 复选框: icheck 气泡: grumble 隐藏元素: Headroom

Zookeeper安装和配置说明

一、Zookeeper的搭建方式 Zookeeper安装方式有三种,单机模式和集群模式以及伪集群模式。 ■ 单机模式:Zookeeper只运行在一台服务器上,适合测试环境; ■ 伪集群模式:就是在一台物理机上运行多个Zookeeper 实例; ■ 集群模式:Zookeeper运行于一个集群上,适合生产环境,这个计算机集群被称为一个“集合体”(ensemble) Zookeeper通过复制来实现

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

hadoop开启回收站配置

开启回收站功能,可以将删除的文件在不超时的情况下,恢复原数据,起到防止误删除、备份等作用。 开启回收站功能参数说明 (1)默认值fs.trash.interval = 0,0表示禁用回收站;其他值表示设置文件的存活时间。 (2)默认值fs.trash.checkpoint.interval = 0,检查回收站的间隔时间。如果该值为0,则该值设置和fs.trash.interval的参数值相等。

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数