Linux安装Hadoop(单机版)详细教程

2024-08-31 06:20

本文主要是介绍Linux安装Hadoop(单机版)详细教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一、JDK安装

1、下载JDK安装包

2、解压下载的JDK安装包

3、移动并重命名JDK包

4、配置Java环境变量

5、验证安装是否成功

二、Hadoop安装

1、下载Hadoop安装包

2、解压Hadoop安装包

3、配置Hadoop环境变量

4、修改配置文件

5、验证Hadoop是否安装成功

三:配置Hadoop

1. 修改配置文件core-site.xml

2、修改配置文件 hdfs-site.xml

四、配置SSH免密登录

1、创建公钥和私钥

2、将公钥添加到authorized_keys文件中

五、启动Hadoop

1、初始化namenode

2、启动HDFS

3、启动YARN

4、查看启动进程


一、JDK安装

JDK也被称为Java Development Kit,JDK1.8是Java编程语言的一个重要版本。Hadoop是一个开源的分布式计算框架,主要用于处理大规模数据集。它主要由Java语言编写,因此安装Hadoop之前需要先安装Java开发工具包(JDK)。

1、下载JDK安装包

wget --no-check-certificate https://repo.huaweicloud.com/java/jdk/8u151-b12/jdk-8u151-linux-x64.tar.gz

2、解压下载的JDK安装包

tar -zxvf jdk-8u151-linux-x64.tar.gz

3、移动并重命名JDK包

mv jdk1.8.0_151/ /usr/java8

4、配置Java环境变量

echo 'export JAVA_HOME=/usr/java8' >> /etc/profile
echo 'export PATH=$PATH:$JAVA_HOME/bin' >> /etc/profile
source /etc/profile

5、验证安装是否成功

java -version

二、Hadoop安装

1、下载Hadoop安装包

wget --no-check-certificate https://repo.huaweicloud.com/apache/hadoop/common/hadoop-3.1.3/hadoop-3.1.3.tar.gz

2、解压Hadoop安装包

tar -zxvf hadoop-3.1.3.tar.gz -C /opt/
mv /opt/hadoop-3.1.3 /opt/hadoop

3、配置Hadoop环境变量

echo 'export HADOOP_HOME=/opt/hadoop/' >> /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/bin' >> /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/sbin' >> /etc/profile
source /etc/profile

4、修改配置文件

echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/yarn-env.sh
echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/hadoop-env.sh

5、验证Hadoop是否安装成功

hadoop version

出现以下信息,表示安装成功。

三:配置Hadoop

1. 修改配置文件core-site.xml

①进入编辑模式

vim /opt/hadoop/etc/hadoop/core-site.xml

②在<configuration></configuration>节点内插入如下内容

 <property><name>hadoop.tmp.dir</name><value>file:/opt/hadoop/tmp</value><description>location to store temporary files</description></property><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property>

如下图所示:

③保存并退出编辑模式

2、修改配置文件 hdfs-site.xml

①进入编辑模式

vim /opt/hadoop/etc/hadoop/hdfs-site.xml

②在<configuration></configuration>节点内插入如下内容

 <property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>file:/opt/hadoop/tmp/dfs/name</value></property><property><name>dfs.datanode.data.dir</name><value>file:/opt/hadoop/tmp/dfs/data</value></property>
<property><name>dfs.namenode.http-address</name><value>0.0.0.0:50070</value>
</property>

如下图所示:

③保存并退出编辑模式

四、配置SSH免密登录

1、创建公钥和私钥

ssh-keygen -t rsa

2、将公钥添加到authorized_keys文件中

cd ~
cd .ssh
cat id_rsa.pub >> authorized_keys

五、启动Hadoop

1、初始化namenode

hadoop namenode -format

2、启动HDFS

start-dfs.sh

start-dfs.sh是 Hadoop 分布式文件系统(HDFS)的一个脚本,用于启动HDFS集群中的所有守护进程,包括NameNode、DataNode 和 Secondary NameNode。

若出现如下报错:

则进行以下操作:

①编辑/etc/profile

vi /etc/profile

②在文件末尾加入以下内容

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

③激活配置文件

source /etc/profile

④再次执行

start-dfs.sh

3、启动YARN

start-yarn.sh

4、查看启动进程

jps

若有以下6个进程,说明Hadoop启动成功

ResourceManager
DataNode
Jps
NodeManager
NameNode
SecondaryNameNode

这篇关于Linux安装Hadoop(单机版)详细教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1123127

相关文章

windows下安装Nginx全过程

《windows下安装Nginx全过程》文章介绍了HTTP和反向代理服务器的概念,包括正向代理和反向代理的区别,并详细描述了如何安装和配置Nginx作为反向代理服务器... 目录概念代理正向代理反向代理安装基本属性nginx.conf查询结构属性使用运行重启停止总结概念是一个高性能的HTTP和反向代理we

Linux内核定时器使用及说明

《Linux内核定时器使用及说明》文章详细介绍了Linux内核定时器的特性、核心数据结构、时间相关转换函数以及操作API,通过示例展示了如何编写和使用定时器,包括按键消抖的应用... 目录1.linux内核定时器特征2.Linux内核定时器核心数据结构3.Linux内核时间相关转换函数4.Linux内核定时

Linux镜像文件制作方式

《Linux镜像文件制作方式》本文介绍了Linux镜像文件制作的过程,包括确定磁盘空间布局、制作空白镜像文件、分区与格式化、复制引导分区和其他分区... 目录1.确定磁盘空间布局2.制作空白镜像文件3.分区与格式化1) 分区2) 格式化4.复制引导分区5.复制其它分区1) 挂载2) 复制bootfs分区3)

JavaWeb项目创建、部署、连接数据库保姆级教程(tomcat)

《JavaWeb项目创建、部署、连接数据库保姆级教程(tomcat)》:本文主要介绍如何在IntelliJIDEA2020.1中创建和部署一个JavaWeb项目,包括创建项目、配置Tomcat服务... 目录简介:一、创建项目二、tomcat部署1、将tomcat解压在一个自己找得到路径2、在idea中添加

SQL Server中行转列方法详细讲解

《SQLServer中行转列方法详细讲解》SQL行转列、列转行可以帮助我们更方便地处理数据,生成需要的报表和结果集,:本文主要介绍SQLServer中行转列方法的相关资料,需要的朋友可以参考下... 目录前言一、为什么需要行转列二、行转列的基本概念三、使用PIVOT运算符进行行转列1.创建示例数据表并插入数

Python + Streamlit项目部署方案超详细教程(非Docker版)

《Python+Streamlit项目部署方案超详细教程(非Docker版)》Streamlit是一款强大的Python框架,专为机器学习及数据可视化打造,:本文主要介绍Python+St... 目录一、针对 Alibaba Cloud linux/Centos 系统的完整部署方案1. 服务器基础配置(阿里

Spring IOC核心原理详解与运用实战教程

《SpringIOC核心原理详解与运用实战教程》本文详细解析了SpringIOC容器的核心原理,包括BeanFactory体系、依赖注入机制、循环依赖解决和三级缓存机制,同时,介绍了SpringBo... 目录1. Spring IOC核心原理深度解析1.1 BeanFactory体系与内部结构1.1.1

SpringBoot集成iText快速生成PDF教程

《SpringBoot集成iText快速生成PDF教程》本文介绍了如何在SpringBoot项目中集成iText9.4.0生成PDF文档,包括新特性的介绍、环境准备、Service层实现、Contro... 目录SpringBoot集成iText 9.4.0生成PDF一、iText 9新特性与架构变革二、环

JAVA SpringBoot集成Jasypt进行加密、解密的详细过程

《JAVASpringBoot集成Jasypt进行加密、解密的详细过程》文章详细介绍了如何在SpringBoot项目中集成Jasypt进行加密和解密,包括Jasypt简介、如何添加依赖、配置加密密钥... 目录Java (SpringBoot) 集成 Jasypt 进行加密、解密 - 详细教程一、Jasyp

2025最新版Android Studio安装及组件配置教程(SDK、JDK、Gradle)

《2025最新版AndroidStudio安装及组件配置教程(SDK、JDK、Gradle)》:本文主要介绍2025最新版AndroidStudio安装及组件配置(SDK、JDK、Gradle... 目录原生 android 简介Android Studio必备组件一、Android Studio安装二、A