Hadoop-2.7.1安装与配置

2024-09-04 16:18
文章标签 配置 安装 2.7 hadoop

本文主要是介绍Hadoop-2.7.1安装与配置,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Hadoop-2.7.1安装与配置

     前面我们说了,旧版hadoop-1.2.1的安装配置,这也是好几年前的版本了吧。而现在最新版本是hadoop-2.7.1 。虽然,大体上hadoop的安装步骤基本一致,但是最新版本与hadoop-1.2.1不管是目录结构,亦或是脚本什么的都有了个很大的改变。所以,我便有写了一篇关于hadoop-2.7.1的安装配置博客。当然,最好的教程还是在官网,所以本文仅供参考,真正可行的还是在官网: http://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-common/SingleCluster.html

一、准备

jdk-7u17-linux-x64.tar.gz

hadoop-2.7.1.tar.gz

二、jdk、ssh安装

      可以参考前面的安装步骤:

http://cyw.iteye.com/blog/2251727

三、安装hadoop-2.7.1

1、将hadoop-2.7.1.tar.gz放在桌面,打开终端,cp到喜欢的目录之下。比如我安装在/home/hadoop/目录下

cp hadoop-2.7.1.tar.gz /home/hadoop/ 

 

 

2、解压安装hadoop-2.7.1

sudo tar -zxvf hadoop-2.7.1.tar.gz 

 

3、进入hadoop-2.7.1文件夹,配置环境变量,打开etc/hadoop/hadoop-env.sh。

sudo gedit etc/hadoop/hadoop-env.sh

 

 在文件里编辑如下JAVA_HOME变量,改为自己的java安装目录:

export JAVA_HOME=/usr/lib/java/jdk1.7.0_17 

 

4、进入hadoop文件夹

bin/hadoop

 

      输出如下:



 

5、如果是单机模式的话,这是便可以使用了:



 

6、如果是伪分布式的话,则还需要配置一些。打开etc/hadoop/core-site.xml

      sudo gedit etc/hadoop/core-site.xml

 

 编辑内容如下:

<configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property></configuration>

 

 

7、打开etc/hadoop/hdfs-site.xml

sudo gedit etc/hadoop/hdfs-site.xml

 

 编辑内容如下:

<configuration><property><name>dfs.replication</name><value>1</value></property>
</configuration>

 

 

8、此时,hdfs的配置已经完成。可以开启namenode 、secondarynomenode、datanode了。此时,hadoop-2.7.1建议我们使用hdfs而不是hadoop脚本,而且部分hdfs的操作放在sbin目录的脚本里面。所以:

 #格式化namenodebin/hdfs namenode -format#开启hdfs的相关节点sbin/start-dfs.sh#关闭hdfs节点sbin/stop-dfs.sh

 

可以使用浏览器url:localhost:50070进行web查看管理。

 

9、配置yarn计算框架(算是Map/Reduce的升级版)

 打开etc/hadoop/mapred-queues.xml.template

sudo gedit etc/hadoop/mapred-queues.xml.template

 

 编辑内容如下:

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property></configuration>

 

 

10、打开etc/hadoop/yarn.site.xml

sudo gedit etc/hadoop/yarn-site.xml

 

 编辑如下:

<configuration><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>
</configuration>

 

 

11、此时,关于yarn计算框架也配置完成了,可以开始使用了。

  #启动yarnsbin/start-yarn.sh#关闭yarnsbin/stop-yarn.sh

 

 

    12、已经配置完成,全部开启之后,输入命令:

 jps

 


出现以上输出,即是说明安装配置完成了。

注意:如果在开启的时候,出现无法创建、打开目录文件的情况时,即是说明,当前用户没有此文件操作权限,所以需要修改权限:

 sudo chmod 777 *

     尤其是修改hadoop-2.7.1目录、logs目录及其中文件、etc目录及其中的hadoop目录及其其中的文件,这些的权限。

      以上,便安装配置完成了。以下链接是所需要的安装包:

http://pan.baidu.com/s/14uFy2

      以及hadoop-1.2.1的安装配置文章: 

http://cyw.iteye.com/blog/2251727

这篇关于Hadoop-2.7.1安装与配置的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1136416

相关文章

Zookeeper安装和配置说明

一、Zookeeper的搭建方式 Zookeeper安装方式有三种,单机模式和集群模式以及伪集群模式。 ■ 单机模式:Zookeeper只运行在一台服务器上,适合测试环境; ■ 伪集群模式:就是在一台物理机上运行多个Zookeeper 实例; ■ 集群模式:Zookeeper运行于一个集群上,适合生产环境,这个计算机集群被称为一个“集合体”(ensemble) Zookeeper通过复制来实现

CentOS7安装配置mysql5.7 tar免安装版

一、CentOS7.4系统自带mariadb # 查看系统自带的Mariadb[root@localhost~]# rpm -qa|grep mariadbmariadb-libs-5.5.44-2.el7.centos.x86_64# 卸载系统自带的Mariadb[root@localhost ~]# rpm -e --nodeps mariadb-libs-5.5.44-2.el7

Centos7安装Mongodb4

1、下载源码包 curl -O https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-4.2.1.tgz 2、解压 放到 /usr/local/ 目录下 tar -zxvf mongodb-linux-x86_64-rhel70-4.2.1.tgzmv mongodb-linux-x86_64-rhel70-4.2.1/

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

hadoop开启回收站配置

开启回收站功能,可以将删除的文件在不超时的情况下,恢复原数据,起到防止误删除、备份等作用。 开启回收站功能参数说明 (1)默认值fs.trash.interval = 0,0表示禁用回收站;其他值表示设置文件的存活时间。 (2)默认值fs.trash.checkpoint.interval = 0,检查回收站的间隔时间。如果该值为0,则该值设置和fs.trash.interval的参数值相等。

NameNode内存生产配置

Hadoop2.x 系列,配置 NameNode 内存 NameNode 内存默认 2000m ,如果服务器内存 4G , NameNode 内存可以配置 3g 。在 hadoop-env.sh 文件中配置如下。 HADOOP_NAMENODE_OPTS=-Xmx3072m Hadoop3.x 系列,配置 Nam

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

wolfSSL参数设置或配置项解释

1. wolfCrypt Only 解释:wolfCrypt是一个开源的、轻量级的、可移植的加密库,支持多种加密算法和协议。选择“wolfCrypt Only”意味着系统或应用将仅使用wolfCrypt库进行加密操作,而不依赖其他加密库。 2. DTLS Support 解释:DTLS(Datagram Transport Layer Security)是一种基于UDP的安全协议,提供类似于

Centos7安装JDK1.8保姆版

工欲善其事,必先利其器。这句话同样适用于学习Java编程。在开始Java的学习旅程之前,我们必须首先配置好适合的开发环境。 通过事先准备好这些工具和配置,我们可以避免在学习过程中遇到因环境问题导致的代码异常或错误。一个稳定、高效的开发环境能够让我们更加专注于代码的学习和编写,提升学习效率,减少不必要的困扰和挫折感。因此,在学习Java之初,投入一些时间和精力来配置好开发环境是非常值得的。这将为我