Win10不需要Cygwin搭建大数据测试环境（1）-Hadoop

本文主要是介绍Win10不需要Cygwin搭建大数据测试环境（1）-Hadoop，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

系列文章

1：《Win10不需要Cygwin搭建大数据测试环境（1）-Hadoop》
2：《Win10不需要Cygwin搭建大数据测试环境（2）-HBase》
3：《Win10不需要Cygwin搭建大数据测试环境（3）-Java操作HBase》
4：《Win10不需要Cygwin搭建大数据测试环境（4）-Hive》

前言

一直想在windows上装一个hadoop，总是需要cygwin，这个东西一直不是很喜欢，所以一直没有在windows下安装。
今天偶然发现了一篇文章，不需要cygwin，马上尝试一下。
本文是主要参考的文章
http://toodey.com/2015/08/10/hadoop-installation-on-windows-without-cygwin-in-10-mints/

准备工作

1：安装JDK1.8。
2：环境变量中添加JAVA_HOME。
3：下载hadoop2.7.3。
4：解压到D盘，路径为D:\hadoop2.7.3。
5：环境变量中添加HADOOP_HOME=D:\hadoop2.7.3\
6：将D:\hadoop2.7.3\bin和D:\hadoop2.7.3\sbin添加到path中。
7：下载一个重要的东西。

hadooponwindows
地址：https://github.com/sardetushar/hadooponwindows
这个是基于hadoop2.7.1的，作者一直没有更新。但是2.7.3是可以运行的，不知道以后会怎么想样！如果谁有时间可以搞一下这个！

8：删除hadoop下的etc和bin。
9：将hadooponwindows里的etc和bin拷贝到D:\hadoop2.7.1\下。

准备工作完成。

修改配置文件

1：etc/hadoop/core-site.xml

<configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property>
</configuration>

2：etc/hadoop/mapred-site.xml

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

3：etc/hadoop/hdfs-site.xml

需要参一下这个连接，解释地址参数如何写。

http://stackoverflow.com/questions/34871814/failed-to-start-namenode-in-hadoop

<configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>file:/hadoop-2.7.3/data/namenode</value></property><property><name>dfs.datanode.data.dir</name><value>file:/hadoop-2.7.3/data/datanode</value></property>
</configuration>

4：etc\hadoop\yarn-site.xml

<configuration><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value></property>
</configuration>

5：etc/hadoop/hadoop-env.cmd

@rem set JAVA_HOME=%JAVA_HOME%
set JAVA_HOME=C:\PROGRA~1\Java\jdk1.8.0_111

“program files”由于有空格所以会出错，采用上面的形式就OK了。

执行操作

1：格式化namenode

hdfs namenode -format

2：启动Hadoop

sbin目录下执行

start-all
　
启动了4个窗口，namenode,datanode,yarn resourcemanager,yarn nodemanager.

小插曲：其中yarn resourcemanager这个报错，提示8088端口被占用。结果是我本地的一个软件把这个端口给用了，停掉软件，重新启动正常。

3：停止Hadoop

sbin下执行

stop-all
Hadoop都停止了。

结束语

这样hadoop就在windows上正常运行了。

Resourcemanager GUI address - http://localhost:8088

Namenode GUI address – http://localhost:50070

至此windows下Hadoop安装成功！

这篇关于Win10不需要Cygwin搭建大数据测试环境（1）-Hadoop的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

Win10不需要Cygwin搭建大数据测试环境（1）-Hadoop

系列文章

前言

准备工作

修改配置文件

1：etc/hadoop/core-site.xml

2：etc/hadoop/mapred-site.xml

3：etc/hadoop/hdfs-site.xml

4：etc\hadoop\yarn-site.xml

5：etc/hadoop/hadoop-env.cmd

执行操作

1：格式化namenode

2：启动Hadoop

3：停止Hadoop

结束语

相关文章

SQLite3 在嵌入式C环境中存储音频/视频文件的最优方案

如何使用Haporxy搭建Web群集

一文详解如何在idea中快速搭建一个Spring Boot项目

python常见环境管理工具超全解析

Python中使用uv创建环境及原理举例详解

python获取cmd环境变量值的实现代码

如何搭建并配置HTTPD文件服务及访问权限控制

pytest+allure环境搭建+自动化实践过程

使用vscode搭建pywebview集成vue项目实践

VS配置好Qt环境之后但无法打开ui界面的问题解决