Hadoop 生态圈 ————ZooKeeper组件

2024-03-04 13:30

本文主要是介绍Hadoop 生态圈 ————ZooKeeper组件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ZooKeeper是一个开源的分布式应用程序协调服务,是Google的Chubby一个开源的实现,它是集群的管理者,监视着集群中各个节点的状态,根据节点提交的反馈进行下一步合理操作。最终,将简单易用的接口、性能高效和功能稳定的系统提供给用户。

ZooKeeper的核心是原子广播,这个机制保证了各个Server之间的同步。实现这个机制的协议叫做Zab协议。Zab协议有两种模式,它们分别是恢复模式(选主)和广播模式(同步)。当服务启动或者在领导者崩溃后,Zab就进入了恢复模式,当领导者被选举出来,且大多数Server完成了和leader的状态同步以后,恢复模式就结束了。状态同步保证了leader和Server具有相同的系统状态。

ZooKeeper安装模式分为:单机模式安装、伪分布式安装和集群模式安装。

Zookeeper的特点:

(1)最终一致性:为客户端展示同一视图,这是ZooKeeper最重要的功能。

(2)可靠性:如果消息被一台服务器接受,那么它将被所有的服务器接受。

(3)实时性:ZooKeeper不能保证两个客户端能同时得到刚更新的数据,如果需要最新数据,应该在读数据之前调用sync()接口。

(4)等待无关(wait-free):慢的或者失效的client不干预快速的client的请求。

(5)原子性:更新只能成功或者失败,没有中间状态。

(6)顺序性:所有Server,同一消息发布顺序一致。

用到ZooKeeper的系统:

(1)HDFS中的HA方案。

(2)YARN的HA方案。

(3)Hbase:必须依赖ZooKeeper,保存了Regionserver的心跳信息,和其他的一些关键信息。

(4)Flume:负载均衡,单点故障。

ZooKeeper的基本架构如下图所示:

(1)每个Server在内存中存储了一份数据。

(2)Zookeeper启动时,将从实例中选举一个leader(Paxos协议)。

(3)Leader负责处理数据更新等操作(Zab协议)。

(4)一个更新操作成功,当且仅当大多数Server在内存中成功修改数据。

Zookpeeper Server节点的数目一般为奇数,Leader选举算法采用了Paxos协议;Paxos核心思想:当多数Server写成功,则任务数据写成功。也就是说:如果有3个Server,则两个写成功即可,如果有4或5个Server,则三个写成功即可,Server数目一般为奇数(3、5、7...),如果有3个Server,则最多允许1个Server挂掉。

       ZooKeeper主要负责Hadoop集群的一些数据管理问题,如:命名服务、配置管理、状态同步、集群管理、队列管理、分布式锁等。

       ZooKeeper类似于文件系统+监测通知,它维护了一个类似文件系统的树形数据结构ZNode,ZNode节点下可以添加子节点或存储数据。

       ZooKeeper集群是分布式的、一致性的集群,具有容错性、可扩展、高性能等优点,可以配置多个Server节点,官方推荐部署奇数个(2n+1个),集群只要有半数以上(n+1个)的Server节点存活就可以正常对外提供服务。

       ZooKeeper采用写任意的方式,即对数据的修改可以提交给任意一个Server节点,而数据的读取是并行的,节点越多吞吐和响应能力越高。

       ZooKeeper各个Server之间的数据同步依靠Zab协议,Zab协议有两种模式:恢复模式(选举)和广播模式(同步)。当ZooKeeper重启或者Leader节点荡掉后,Zab就进入恢复模式,当Leader选举成功且大多数Server完成了和Leader的状态同步后,Zab就进入广播模式。

       ZooKeeper各个Server之间的选举通过Paxos算法。当Leader崩溃或者Leader失去大多数Follower时,ZooKeeper进入恢复模式重新选举Leader,如果某个Server获得半数以上的票数即成为新的Leader,ZooKeeper进入广播模式并同步数据状态,集群重新对外提供服务。

                                                                                                     郑州新思齐科技有限公司

                                                                                                                 王亚辉

这篇关于Hadoop 生态圈 ————ZooKeeper组件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/773316

相关文章

Java使用Curator进行ZooKeeper操作的详细教程

《Java使用Curator进行ZooKeeper操作的详细教程》ApacheCurator是一个基于ZooKeeper的Java客户端库,它极大地简化了使用ZooKeeper的开发工作,在分布式系统... 目录1、简述2、核心功能2.1 CuratorFramework2.2 Recipes3、示例实践3

Vue中组件之间传值的六种方式(完整版)

《Vue中组件之间传值的六种方式(完整版)》组件是vue.js最强大的功能之一,而组件实例的作用域是相互独立的,这就意味着不同组件之间的数据无法相互引用,针对不同的使用场景,如何选择行之有效的通信方式... 目录前言方法一、props/$emit1.父组件向子组件传值2.子组件向父组件传值(通过事件形式)方

Spring组件初始化扩展点BeanPostProcessor的作用详解

《Spring组件初始化扩展点BeanPostProcessor的作用详解》本文通过实战案例和常见应用场景详细介绍了BeanPostProcessor的使用,并强调了其在Spring扩展中的重要性,感... 目录一、概述二、BeanPostProcessor的作用三、核心方法解析1、postProcessB

kotlin中的行为组件及高级用法

《kotlin中的行为组件及高级用法》Jetpack中的四大行为组件:WorkManager、DataBinding、Coroutines和Lifecycle,分别解决了后台任务调度、数据驱动UI、异... 目录WorkManager工作原理最佳实践Data Binding工作原理进阶技巧Coroutine

Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)

《Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)》文章介绍了如何使用dhtmlx-gantt组件来实现公司的甘特图需求,并提供了一个简单的Vue组件示例,文章还分享了一... 目录一、首先 npm 安装插件二、创建一个vue组件三、业务页面内 引用自定义组件:四、dhtmlx

Vue ElementUI中Upload组件批量上传的实现代码

《VueElementUI中Upload组件批量上传的实现代码》ElementUI中Upload组件批量上传通过获取upload组件的DOM、文件、上传地址和数据,封装uploadFiles方法,使... ElementUI中Upload组件如何批量上传首先就是upload组件 <el-upl

Vue3中的动态组件详解

《Vue3中的动态组件详解》本文介绍了Vue3中的动态组件,通过`component:is=动态组件名或组件对象/component`来实现根据条件动态渲染不同的组件,此外,还提到了使用`markRa... 目录vue3动态组件动态组件的基本使用第一种写法第二种写法性能优化解决方法总结Vue3动态组件动态

四种Flutter子页面向父组件传递数据的方法介绍

《四种Flutter子页面向父组件传递数据的方法介绍》在Flutter中,如果父组件需要调用子组件的方法,可以通过常用的四种方式实现,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录方法 1:使用 GlobalKey 和 State 调用子组件方法方法 2:通过回调函数(Callb

Vue项目中Element UI组件未注册的问题原因及解决方法

《Vue项目中ElementUI组件未注册的问题原因及解决方法》在Vue项目中使用ElementUI组件库时,开发者可能会遇到一些常见问题,例如组件未正确注册导致的警告或错误,本文将详细探讨这些问题... 目录引言一、问题背景1.1 错误信息分析1.2 问题原因二、解决方法2.1 全局引入 Element

vue解决子组件样式覆盖问题scoped deep

《vue解决子组件样式覆盖问题scopeddeep》文章主要介绍了在Vue项目中处理全局样式和局部样式的方法,包括使用scoped属性和深度选择器(/deep/)来覆盖子组件的样式,作者建议所有组件... 目录前言scoped分析deep分析使用总结所有组件必须加scoped父组件覆盖子组件使用deep前言