Hadoop生态最牛逼的组件，HDFS排第二，它排第一！

本文主要是介绍Hadoop生态最牛逼的组件，HDFS排第二，它排第一！，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

曾有人调侃：HBase 没有资源什么事情也做不了，Spark 占用了资源却没有事情可做？

那 YARN了解一下？

YARN！

伴随着Hadoop生态的发展，不断涌现了多种多样的技术组件 Hive、HBase、Spark……它们在丰富了大数据生态体系的同时，也引发了新的问题思考。

熟悉大数据底层平台的朋友，应该都了解这些为大数据场景设计的技术组件不仅个个都是消耗资源的大户，而且它们本有一套自己的资源调度系统用来管理任务的资源分配，但同时部署在一起的时候就出问题了：

一、某些组件可能申请不到服务器资源。

二、可能会出现资源分配不合理的情况，导致整体资源使用率偏低。

为了解决这些问题，则迫切需要一种通用的资源调度框架，对整个集群的资源进行统筹管理。

YARN有何优势？

YARN 在 Hadoop 集群中充当资源管理和任务调度的框架，可为上层应用提供统一的资源管理和调度，它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。

YARN 解决了 Hadoop 第一代集群资源调度框架上可靠性差、扩展性差等一系列问题，我们来看一下它的优势：

1. 提出了 HDFS Federation，能够让多个 NameNode 分管不同的目录进而实现访问隔离和横向扩展；

2. 将资源管理和作业控制分离，ResouceManager专管资源管理和调度，ApplicationMaster负责与具体应用程序相关的任务切分、任务调度和容错等，每个应用程序对应一个ApplicationMaster；

3. 具有向后兼容性，用户在 MRv1上运行的作业，不用修改即可运行在 YARN 之上；

4. 能够支持不同的计算框架，可以将各种各样的计算框架移植到 YARN 之上，由 YARN 进行统一管理和资源分配；

5. 框架升级更容易，各种计算框架不再是作为一个服务部署到集群的各个节点上而是被封装成一个用户程序库（lib）存放在客户端，想对计算框架进行升级时，只要升级用户程序库即可。

众所周知，Spark、Hive等一系列服务都可以作为应用运行在YARN之上，统一使用 YARN 为整个集群资源进行宏观的调度与分配。

而对于学习YARN不仅为了应对工作上遇到的相关技术问题，更是因为想要成功进入阿里、字节还是美团等互联网大厂，YARN在面试时都是高频考点，所以掌握它至关重要。

正好我也在在补 Hadoop 生态的核心原理，这里推荐一门刚撸完的独家好课，由前58技术委员会主席孙玄，结合10多年一线大厂实践经验，打造的《源码级剖析分布式资源调度引擎 YARN 内核》在线专栏。3 天时间，12节干货，带你从大数据高峰视角，彻底看透 YARN 的内核设计本质。

原价 ¥499，限时 ¥0.99 立刻学习！

长按扫码👆，锁定 ¥0.99 名额

仅前 50 人有效，先到先得！

报名即享受大厂专属内推

更有求职大礼包，免费送～

主讲马中华老师，是阿里云/腾讯云认证的全球首位金牌讲师，在 Oracle 有多年的大数据开发经验。跟着他学习 YARN 的源码架构与内核，有问题就在直播间和群里随时提问，几乎没有什么好顾虑的。况且，前转转公司大数据资深架构师、Hadoop平台负责人李希沅老师也会加入授课，解答你所以大数据的核心问题。

这套在线专栏原价 499，现在花 0.99 元，就能马上学习，绝对相当划算。重要的是现在课程重磅升级，升级后的课程体系紧随一线互联网大厂前沿技术，新增实战项目、高级商业项目，全方位提升学员实战能力，全面提升课程的实用性、先进性。

12 节名师精心打磨的大数据架构师必备技术知识精品课程，10月18日 - 20日，3天速成，晚20:00-22:00点，助你赶超下一个行业风口。

重要提醒：一次报名，全程赠送讲师答疑服务！报名即可领取价值 99 元的 12 本程序员必读电子书目。数据库、Hadoop、Docker、Hive、Hbase 一应俱全，帮助你在通过课程提升的基础上，从理论层面全面进阶。

VIP课程免费领取：报名就送价值 499元的【SparkStreaming企业级实战训练营】，针对企业级实时处理方案进行全方位的讲解。内容包含：SparkStreaming技术的核心原理剖析，SparkStreaming项目的企业级架构设计方案，SparkStreaming实时任务的监控告警架构设计方案等。