详解 WordCount 运行后历史日志记录

2024-06-07 15:58

本文主要是介绍详解 WordCount 运行后历史日志记录,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在 《Hadoop-2.5.0-cdh5.3.2 HA 安装》 一文中我们已经详细讲述了如何搭建 HA 模式,同时最后还演示了运行其自带的 wordcount 程序,详情请参考 运行 Hadoop自带 wordcount 程序 。先简要回顾下:

  • 一 Hadoop 日志基本概念
    • 1 运行 wordcount 程序
    • 2 控制台输出结果
  • 二 Hadoop History 服务器网页详解
    • 1 ResourceManager Web 界面
    • 2 application 界面
    • 3 Job Overview 界面
    • 4 小结
  • 三 Hadoop 任务运行日志 Container 日志 收集过程详解
  • 四 Hadoop 作业日志收集过程详解
    • 1 步骤一启动作业的 ApplicationMaster 并写日志至 HDFS
    • 2 步骤二HDFS 内转移历史运行日志
    • 3 步骤三 周期转移 done_intermediate 中的日志文件到 done 目录
    • 4 概念拓展


一. Hadoop 日志基本概念

1. Hadoop 系统服务日志

2. Mapreduce 程序日志

  • 作业运行日志
  • 任务运行日志 (Container 日志)

其中需要我们关注容易混淆的概念:

  • Mapreduce 程序日志 的查看是需要开启 历史日志服务器 后才能查看到
  • 其中 日志聚集 功能是针对 任务运行日志 (Container 日志) 而言的!

更多关于Hadoop 日志原理以及相应配置请参考:http://blog.csdn.net/u011414200/article/details/50338073


1.1 运行 wordcount 程序

  • 已经启动了必需的各项进程:namenode、datanode、resourcemanager、nodemanager、JobHistoryServer 等

  • 确保当前 hdfs 不处于安全模式

hdfs dfsadmin -safemode leave
  • 确保已经在 HDFS 中创建了相关目录 /data/wordcount/output ,以下 /tmp 及其以下目录是启动 JobHistoryServer 后系统自动生成的

  • 上传了测试数据集 slaves

    这里写图片描述

hadoop fs -put /usr/local/cluster/hadoop/etc/hadoop/slaves /data/wordcount/
  • 进入程序所在目录,并运行程序
cd /usr/local/cluster/hadoop/share/hadoop/mapreduce 
hadoop jar hadoop-mapreduce-examples-2.5.0-cdh5.3.2.jar wordcount /data/wordcount /output/wordcount

1.2 控制台输出结果

15/12/22 00:30:36 INFO input.FileInputFormat: Total input paths to process : 1
15/12/22 00:30:37 INFO mapreduce.JobSubmitter: number of splits:1
15/12/22 00:30:37 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1450714294593_0001
15/12/22 00:30:37 INFO impl.YarnClientImpl: Submitted application application_1450714294593_0001
15/12/22 00:30:37 INFO mapreduce.Job: The url to track the job: http://master5:8088/proxy/application_1450714294593_0001/
15/12/22 00:30:37 INFO mapreduce.Job: Running job: job_1450714294593_0001
15/12/22 00:30:43 INFO mapreduce.Job: Job job_1450714294593_0001 running in uber mode : false
15/12/22 00:30:43 INFO mapreduce.Job:  map 0% reduce 0%
15/12/22 00:30:49 INFO mapreduce.Job:  map 100% reduce 0%
15/12/22 00:31:04 INFO mapreduce.Job:  map 100% reduce 100%
15/12/22 00:31:05 INFO mapreduce.Job: Job job_1450714294593_0001 completed successfully
15/12/22 00:31:05 INFO mapreduce.Job: Counters: 49File System CountersFILE: Number of bytes read=48FILE: Number of bytes written=212385FILE: Number of read operations=0FILE: Number of large read operations=0FILE: Number of write operations=0HDFS: Number of bytes read=125HDFS: Number of bytes written=30HDFS: Number of read operations=6

这篇关于详解 WordCount 运行后历史日志记录的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1039627

相关文章

Redis实现延迟任务的三种方法详解

《Redis实现延迟任务的三种方法详解》延迟任务(DelayedTask)是指在未来的某个时间点,执行相应的任务,本文为大家整理了三种常见的实现方法,感兴趣的小伙伴可以参考一下... 目录1.前言2.Redis如何实现延迟任务3.代码实现3.1. 过期键通知事件实现3.2. 使用ZSet实现延迟任务3.3

C语言函数递归实际应用举例详解

《C语言函数递归实际应用举例详解》程序调用自身的编程技巧称为递归,递归做为一种算法在程序设计语言中广泛应用,:本文主要介绍C语言函数递归实际应用举例的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录前言一、递归的概念与思想二、递归的限制条件 三、递归的实际应用举例(一)求 n 的阶乘(二)顺序打印

Python Faker库基本用法详解

《PythonFaker库基本用法详解》Faker是一个非常强大的库,适用于生成各种类型的伪随机数据,可以帮助开发者在测试、数据生成、或其他需要随机数据的场景中提高效率,本文给大家介绍PythonF... 目录安装基本用法主要功能示例代码语言和地区生成多条假数据自定义字段小结Faker 是一个 python

Java Predicate接口定义详解

《JavaPredicate接口定义详解》Predicate是Java中的一个函数式接口,它代表一个判断逻辑,接收一个输入参数,返回一个布尔值,:本文主要介绍JavaPredicate接口的定义... 目录Java Predicate接口Java lamda表达式 Predicate<T>、BiFuncti

详解如何通过Python批量转换图片为PDF

《详解如何通过Python批量转换图片为PDF》:本文主要介绍如何基于Python+Tkinter开发的图片批量转PDF工具,可以支持批量添加图片,拖拽等操作,感兴趣的小伙伴可以参考一下... 目录1. 概述2. 功能亮点2.1 主要功能2.2 界面设计3. 使用指南3.1 运行环境3.2 使用步骤4. 核

一文详解JavaScript中的fetch方法

《一文详解JavaScript中的fetch方法》fetch函数是一个用于在JavaScript中执行HTTP请求的现代API,它提供了一种更简洁、更强大的方式来处理网络请求,:本文主要介绍Jav... 目录前言什么是 fetch 方法基本语法简单的 GET 请求示例代码解释发送 POST 请求示例代码解释

详解nginx 中location和 proxy_pass的匹配规则

《详解nginx中location和proxy_pass的匹配规则》location是Nginx中用来匹配客户端请求URI的指令,决定如何处理特定路径的请求,它定义了请求的路由规则,后续的配置(如... 目录location 的作用语法示例:location /www.chinasem.cntestproxy

CSS will-change 属性示例详解

《CSSwill-change属性示例详解》will-change是一个CSS属性,用于告诉浏览器某个元素在未来可能会发生哪些变化,本文给大家介绍CSSwill-change属性详解,感... will-change 是一个 css 属性,用于告诉浏览器某个元素在未来可能会发生哪些变化。这可以帮助浏览器优化

Python基础文件操作方法超详细讲解(详解版)

《Python基础文件操作方法超详细讲解(详解版)》文件就是操作系统为用户或应用程序提供的一个读写硬盘的虚拟单位,文件的核心操作就是读和写,:本文主要介绍Python基础文件操作方法超详细讲解的相... 目录一、文件操作1. 文件打开与关闭1.1 打开文件1.2 关闭文件2. 访问模式及说明二、文件读写1.

详解C++中类的大小决定因数

《详解C++中类的大小决定因数》类的大小受多个因素影响,主要包括成员变量、对齐方式、继承关系、虚函数表等,下面就来介绍一下,具有一定的参考价值,感兴趣的可以了解一下... 目录1. 非静态数据成员示例:2. 数据对齐(Padding)示例:3. 虚函数(vtable 指针)示例:4. 继承普通继承虚继承5.