Hadoop入门基础(五):Hadoop 常用 Shell 命令一网打尽,提升你的大数据技能!

本文主要是介绍Hadoop入门基础(五):Hadoop 常用 Shell 命令一网打尽,提升你的大数据技能!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. Hadoop 基本命令

1.1 查看版本信息

hadoop version

用于检查 Hadoop 的版本信息以及编译信息。

1.2 启动和停止 Hadoop 集群

start-dfs.sh
start-yarn.sh
stop-dfs.sh
stop-yarn.sh

start-dfs.shstop-dfs.sh 分别用于启动和停止 HDFS,而 start-yarn.shstop-yarn.sh 用于管理 YARN 服务。

1.3 格式化 HDFS

hdfs namenode -format

首次安装 Hadoop 后,需要格式化 HDFS。这会清除所有数据,因此仅在初次设置或重置集群时执行。

2. HDFS 相关命令

2.1 HDFS 目录与文件管理

  • 列出目录内容:
    hdfs dfs -ls /path/to/directory
  • 创建新目录:
    hdfs dfs -mkdir /path/to/new_directory
  • 上传文件到 HDFS:
    hdfs dfs -put /local/path/to/file /hdfs/path/to/destination
  • 从 HDFS 下载文件:
    hdfs dfs -get /hdfs/path/to/file /local/path/to/destination
  • 删除文件或目录:
    hdfs dfs -rm /hdfs/path/to/file
    hdfs dfs -rm -r /hdfs/path/to/directory
    

2.2 查看文件内容

hdfs dfs -cat /hdfs/path/to/file

用于查看HDFS中文件的内容。

2.3 文件系统检查

hdfs fsck /

检查 HDFS 的健康状况,显示文件、块和副本的分布信息。

3. MapReduce 相关命令

3.1 运行 MapReduce 示例程序

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar wordcount /input /output

运行 Hadoop 提供的示例程序,这里以 wordcount 为例。

3.2 查看 MapReduce 作业状态

hadoop job -status job_id

用于查询作业的当前状态。

4. YARN 相关命令

4.1 列出所有运行中的应用

yarn application -list

列出所有当前正在 YARN 上运行的应用程序。

4.2 杀死 YARN 应用

yarn application -kill application_id

停止指定的 YARN 应用程序。

4.3 查看应用程序日志

yarn logs -applicationId application_id

获取特定应用程序的日志信息。

5. 其他常用命令

5.1 查看 Hadoop 集群报告

hdfs dfsadmin -report

显示 HDFS 集群的整体健康状况和配置状态。

5.2 安全模式操作

  • 进入安全模式:
    hdfs dfsadmin -safemode enter
  • 离开安全模式:
    hdfs dfsadmin -safemode leave
  • 查看安全模式状态:
    hdfs dfsadmin -safemode get

总结

以上命令涵盖了日常使用 Hadoop 时最常见的操作,掌握这些命令可以帮助你更轻松地管理和维护 Hadoop 集群。通过熟练使用这些命令,你将能够更加自信地应对各种 Hadoop 相关的任务。

这篇关于Hadoop入门基础(五):Hadoop 常用 Shell 命令一网打尽,提升你的大数据技能!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1097697

相关文章

nginx -t、nginx -s stop 和 nginx -s reload 命令的详细解析(结合应用场景)

《nginx-t、nginx-sstop和nginx-sreload命令的详细解析(结合应用场景)》本文解析Nginx的-t、-sstop、-sreload命令,分别用于配置语法检... 以下是关于 nginx -t、nginx -s stop 和 nginx -s reload 命令的详细解析,结合实际应

C#连接SQL server数据库命令的基本步骤

《C#连接SQLserver数据库命令的基本步骤》文章讲解了连接SQLServer数据库的步骤,包括引入命名空间、构建连接字符串、使用SqlConnection和SqlCommand执行SQL操作,... 目录建议配合使用:如何下载和安装SQL server数据库-CSDN博客1. 引入必要的命名空间2.

Linux系统性能检测命令详解

《Linux系统性能检测命令详解》本文介绍了Linux系统常用的监控命令(如top、vmstat、iostat、htop等)及其参数功能,涵盖进程状态、内存使用、磁盘I/O、系统负载等多维度资源监控,... 目录toppsuptimevmstatIOStatiotopslabtophtopdstatnmon

PowerShell中15个提升运维效率关键命令实战指南

《PowerShell中15个提升运维效率关键命令实战指南》作为网络安全专业人员的必备技能,PowerShell在系统管理、日志分析、威胁检测和自动化响应方面展现出强大能力,下面我们就来看看15个提升... 目录一、PowerShell在网络安全中的战略价值二、网络安全关键场景命令实战1. 系统安全基线核查

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Spring Boot中WebSocket常用使用方法详解

《SpringBoot中WebSocket常用使用方法详解》本文从WebSocket的基础概念出发,详细介绍了SpringBoot集成WebSocket的步骤,并重点讲解了常用的使用方法,包括简单消... 目录一、WebSocket基础概念1.1 什么是WebSocket1.2 WebSocket与HTTP

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

golang中reflect包的常用方法

《golang中reflect包的常用方法》Go反射reflect包提供类型和值方法,用于获取类型信息、访问字段、调用方法等,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值... 目录reflect包方法总结类型 (Type) 方法值 (Value) 方法reflect包方法总结

从入门到精通MySQL联合查询

《从入门到精通MySQL联合查询》:本文主要介绍从入门到精通MySQL联合查询,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下... 目录摘要1. 多表联合查询时mysql内部原理2. 内连接3. 外连接4. 自连接5. 子查询6. 合并查询7. 插入查询结果摘要前面我们学习了数据库设计时要满