Hadoop YARN配置参数剖析(2)—权限与日志聚集相关参数

本文主要是介绍Hadoop YARN配置参数剖析(2)—权限与日志聚集相关参数，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

本文转自 http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-configurations-log-aggregation/

注意，配置这些参数前，应充分理解这几个参数的含义，以防止误配给集群带来的隐患。另外，这些参数均需要在yarn-site.xml中配置。

这里的权限由三部分组成，分别是：（1）管理员和普通用户如何区分（2）服务级别的权限，比如哪些用户可以向集群提交ResourceManager提交应用程序，（3）队列级别的权限，比如哪些用户可以向队列A提交作业等。

管理员列表由参数yarn.admin.acl指定。

服务级别的权限是通过配置hadoop-policy.xml实现的，这个与Hadoop 1.0类似

队列级别的权限是由对应的资源调度器内部配置的，比如Fair Scheduler或者Capacity Scheduler等，具体阅读后面几节。

日志聚集是YARN提供的日志中央化管理功能，它能将运行完成的Container/任务日志上传到HDFS上，从而减轻NodeManager负载，且提供一个中央化存储和分析机制。默认情况下，Container/任务日志存在在各个NodeManager上，如果启用日志聚集功能需要额外的配置。

（1） yarn.log-aggregation-enable

参数解释：是否启用日志聚集功能。

默认值：false

（2） yarn.log-aggregation.retain-seconds

参数解释：在HDFS上聚集的日志最多保存多长时间。

默认值：-1

（3） yarn.log-aggregation.retain-check-interval-seconds

参数解释：多长时间检查一次日志，并将满足条件的删除，如果是0或者负数，则为上一个值的1/10。

默认值：-1

（4） yarn.nodemanager.remote-app-log-dir

参数解释：当应用程序运行结束后，日志被转移到的HDFS目录（启用日志聚集功能时有效）。

默认值：/tmp/logs

（5） yarn.nodemanager.remote-app-log-dir-suffix

参数解释：远程日志目录子目录名称（启用日志聚集功能时有效）。

默认值：日志将被转移到目录

${yarn.nodemanager.remote-app-log-dir}/${user}/${thisParam}下

这篇关于Hadoop YARN配置参数剖析(2)—权限与日志聚集相关参数的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！