Nutch-2.2.1学习之二编译部署Nutch及常见问题

2024-01-08 04:32

本文主要是介绍Nutch-2.2.1学习之二编译部署Nutch及常见问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Nutch1.x从1.7版本开始不再提供完整的部署文件,只提供源代码文件及相关的build.xml文件,这就要求用户自己编译Nutch,而整个Nutch2.x版本都不提供编译完成的文件,所以想要学习Nutch2.2.1的功能,就必须自己手动编译文件。这篇文章主要介绍了如何编译Nutch2.2.1版本,同时罗列了一些编译过程中遇到的问题及解决方案。当然不可能列举所有的问题,希望大家可以补充自己遇到的一些问题及解决方法。由于编译Nutch需要使用Ant,以下操作都假设已经安装好Java和Ant,并做好了相应的配置,如JAVA_HOME、ANT_HOME及PATH路径。

1.   要编译Nutch2.2.1,当然要先下载对应的版本,可以从官网直接下载,下载的URL为http://archive.apache.org/dist/nutch/2.2.1/,选择apache-nutch-2.2.1-src.tar.gz下载,我将下载的文件保存在/home/hadoop/BigData中,然后执行tar命令,将文件解压到/home/hadoop目录下。如下图所示:

 
2.   进入apache-nutch-2.2.1目录,执行ls –al命令查看nutch的目录结构,与1.x版本的不同在于,nutch2.x不再有bin目录了,有了新的ivy目录用于使用ivy管理nutch。

 
3.   在nutch主目录下执行ant命令,对ant源代码进行编译。根据各自的带宽情况,所需要的时间是不一样的。下载过程及成功信息如下面两张图所示,在第二张图的最后,可以看到提示信息BUILD SUCCESSFUL,说明编译成功,若提示信息为BUILD FAILED,则说明编译失败,需要根据编译过程中输出的信息查找错误原因。
 

4.   编译成功后,再执行ls –al命令,发现目录结构跟编译前发现了变化。新增了build和runtime目录,这两个目录也是和1.x版本不同的地方之一。

下面会介绍可能会出现的几种错误原因,希望对大家有所帮助。第一个错误如下图所示(但该错误不会影响到编译成功与否),这个问题可以通过查看build.xml,并修改其中的内容解决。具体方法是,在buil.xml中查找org/sonar/ant/antlib.xml,在840行发现该内容。通过查看源文件,build的过程会在ant或者mysql的lib目录中查找sonar的jar包,在没有配置这些属性的情况下找不到jar包就出现了该问题。大家可以将sonar的jar包放到当前目录,并将build文件中的classpath修改为当前目录,或者设置ant或者mysql属性,都可以解决该问题。如上文已经提到过的,此问题不会影响到编译成功与否。

 
另一个影响到编译结果的问题如下图所示,根据输出信息可知,ivy从本地连接http://repo1.maven.org/maven2/仓库时失败。这个问题可以通过用http://mirrors.ibiblio.org/maven2/ URL替换\ivy目录下ivysettings.xml中的http://repo1.maven.org/maven2/解决。代码位置为<property name="repo.maven.org" value="http://repo1.maven.org/maven2/" override="false"/>


或者修改hosts文件,添加72.21.81.253    repo1.maven.org,该方法也可以解决下载问题

 

 

 

 

 

 

这篇关于Nutch-2.2.1学习之二编译部署Nutch及常见问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/582325

相关文章

centos7基于keepalived+nginx部署k8s1.26.0高可用集群

《centos7基于keepalived+nginx部署k8s1.26.0高可用集群》Kubernetes是一个开源的容器编排平台,用于自动化地部署、扩展和管理容器化应用程序,在生产环境中,为了确保集... 目录一、初始化(所有节点都执行)二、安装containerd(所有节点都执行)三、安装docker-

在Ubuntu上部署SpringBoot应用的操作步骤

《在Ubuntu上部署SpringBoot应用的操作步骤》随着云计算和容器化技术的普及,Linux服务器已成为部署Web应用程序的主流平台之一,Java作为一种跨平台的编程语言,具有广泛的应用场景,本... 目录一、部署准备二、安装 Java 环境1. 安装 JDK2. 验证 Java 安装三、安装 mys

Jenkins中自动化部署Spring Boot项目的全过程

《Jenkins中自动化部署SpringBoot项目的全过程》:本文主要介绍如何使用Jenkins从Git仓库拉取SpringBoot项目并进行自动化部署,通过配置Jenkins任务,实现项目的... 目录准备工作启动 Jenkins配置 Jenkins创建及配置任务源码管理构建触发器构建构建后操作构建任务

若依部署Nginx和Tomcat全过程

《若依部署Nginx和Tomcat全过程》文章总结了两种部署方法:Nginx部署和Tomcat部署,Nginx部署包括打包、将dist文件拉到指定目录、配置nginx.conf等步骤,Tomcat部署... 目录Nginx部署后端部署Tomcat部署出现问题:点击刷新404总结Nginx部署第一步:打包

Nginx、Tomcat等项目部署问题以及解决流程

《Nginx、Tomcat等项目部署问题以及解决流程》本文总结了项目部署中常见的four类问题及其解决方法:Nginx未按预期显示结果、端口未开启、日志分析的重要性以及开发环境与生产环境运行结果不一致... 目录前言1. Nginx部署后未按预期显示结果1.1 查看Nginx的启动情况1.2 解决启动失败的

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

闲置电脑也能活出第二春?鲁大师AiNAS让你动动手指就能轻松部署

对于大多数人而言,在这个“数据爆炸”的时代或多或少都遇到过存储告急的情况,这使得“存储焦虑”不再是个别现象,而将会是随着软件的不断臃肿而越来越普遍的情况。从不少手机厂商都开始将存储上限提升至1TB可以见得,我们似乎正处在互联网信息飞速增长的阶段,对于存储的需求也将会不断扩大。对于苹果用户而言,这一问题愈发严峻,毕竟512GB和1TB版本的iPhone可不是人人都消费得起的,因此成熟的外置存储方案开

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;