Nutch-2.2.1学习之二编译部署Nutch及常见问题

2024-01-08 04:32

本文主要是介绍Nutch-2.2.1学习之二编译部署Nutch及常见问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Nutch1.x从1.7版本开始不再提供完整的部署文件,只提供源代码文件及相关的build.xml文件,这就要求用户自己编译Nutch,而整个Nutch2.x版本都不提供编译完成的文件,所以想要学习Nutch2.2.1的功能,就必须自己手动编译文件。这篇文章主要介绍了如何编译Nutch2.2.1版本,同时罗列了一些编译过程中遇到的问题及解决方案。当然不可能列举所有的问题,希望大家可以补充自己遇到的一些问题及解决方法。由于编译Nutch需要使用Ant,以下操作都假设已经安装好Java和Ant,并做好了相应的配置,如JAVA_HOME、ANT_HOME及PATH路径。

1.   要编译Nutch2.2.1,当然要先下载对应的版本,可以从官网直接下载,下载的URL为http://archive.apache.org/dist/nutch/2.2.1/,选择apache-nutch-2.2.1-src.tar.gz下载,我将下载的文件保存在/home/hadoop/BigData中,然后执行tar命令,将文件解压到/home/hadoop目录下。如下图所示:

 
2.   进入apache-nutch-2.2.1目录,执行ls –al命令查看nutch的目录结构,与1.x版本的不同在于,nutch2.x不再有bin目录了,有了新的ivy目录用于使用ivy管理nutch。

 
3.   在nutch主目录下执行ant命令,对ant源代码进行编译。根据各自的带宽情况,所需要的时间是不一样的。下载过程及成功信息如下面两张图所示,在第二张图的最后,可以看到提示信息BUILD SUCCESSFUL,说明编译成功,若提示信息为BUILD FAILED,则说明编译失败,需要根据编译过程中输出的信息查找错误原因。
 

4.   编译成功后,再执行ls –al命令,发现目录结构跟编译前发现了变化。新增了build和runtime目录,这两个目录也是和1.x版本不同的地方之一。

下面会介绍可能会出现的几种错误原因,希望对大家有所帮助。第一个错误如下图所示(但该错误不会影响到编译成功与否),这个问题可以通过查看build.xml,并修改其中的内容解决。具体方法是,在buil.xml中查找org/sonar/ant/antlib.xml,在840行发现该内容。通过查看源文件,build的过程会在ant或者mysql的lib目录中查找sonar的jar包,在没有配置这些属性的情况下找不到jar包就出现了该问题。大家可以将sonar的jar包放到当前目录,并将build文件中的classpath修改为当前目录,或者设置ant或者mysql属性,都可以解决该问题。如上文已经提到过的,此问题不会影响到编译成功与否。

 
另一个影响到编译结果的问题如下图所示,根据输出信息可知,ivy从本地连接http://repo1.maven.org/maven2/仓库时失败。这个问题可以通过用http://mirrors.ibiblio.org/maven2/ URL替换\ivy目录下ivysettings.xml中的http://repo1.maven.org/maven2/解决。代码位置为<property name="repo.maven.org" value="http://repo1.maven.org/maven2/" override="false"/>


或者修改hosts文件,添加72.21.81.253    repo1.maven.org,该方法也可以解决下载问题

 

 

 

 

 

 

这篇关于Nutch-2.2.1学习之二编译部署Nutch及常见问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/582325

相关文章

ESP32 esp-idf esp-adf环境安装及.a库创建与编译

简介 ESP32 功能丰富的 Wi-Fi & 蓝牙 MCU, 适用于多样的物联网应用。使用freertos操作系统。 ESP-IDF 官方物联网开发框架。 ESP-ADF 官方音频开发框架。 文档参照 https://espressif-docs.readthedocs-hosted.com/projects/esp-adf/zh-cn/latest/get-started/index

51单片机学习记录———定时器

文章目录 前言一、定时器介绍二、STC89C52定时器资源三、定时器框图四、定时器模式五、定时器相关寄存器六、定时器练习 前言 一个学习嵌入式的小白~ 有问题评论区或私信指出~ 提示:以下是本篇文章正文内容,下面案例可供参考 一、定时器介绍 定时器介绍:51单片机的定时器属于单片机的内部资源,其电路的连接和运转均在单片机内部完成。 定时器作用: 1.用于计数系统,可

问题:第一次世界大战的起止时间是 #其他#学习方法#微信

问题:第一次世界大战的起止时间是 A.1913 ~1918 年 B.1913 ~1918 年 C.1914 ~1918 年 D.1914 ~1919 年 参考答案如图所示

[word] word设置上标快捷键 #学习方法#其他#媒体

word设置上标快捷键 办公中,少不了使用word,这个是大家必备的软件,今天给大家分享word设置上标快捷键,希望在办公中能帮到您! 1、添加上标 在录入一些公式,或者是化学产品时,需要添加上标内容,按下快捷键Ctrl+shift++就能将需要的内容设置为上标符号。 word设置上标快捷键的方法就是以上内容了,需要的小伙伴都可以试一试呢!

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

C++工程编译链接错误汇总VisualStudio

目录 一些小的知识点 make工具 可以使用windows下的事件查看器崩溃的地方 dumpbin工具查看dll是32位还是64位的 _MSC_VER .cc 和.cpp 【VC++目录中的包含目录】 vs 【C/C++常规中的附加包含目录】——头文件所在目录如何怎么添加,添加了以后搜索头文件就会到这些个路径下搜索了 include<> 和 include"" WinMain 和

Javascript高级程序设计(第四版)--学习记录之变量、内存

原始值与引用值 原始值:简单的数据即基础数据类型,按值访问。 引用值:由多个值构成的对象即复杂数据类型,按引用访问。 动态属性 对于引用值而言,可以随时添加、修改和删除其属性和方法。 let person = new Object();person.name = 'Jason';person.age = 42;console.log(person.name,person.age);//'J

大学湖北中医药大学法医学试题及答案,分享几个实用搜题和学习工具 #微信#学习方法#职场发展

今天分享拥有拍照搜题、文字搜题、语音搜题、多重搜题等搜题模式,可以快速查找问题解析,加深对题目答案的理解。 1.快练题 这是一个网站 找题的网站海量题库,在线搜题,快速刷题~为您提供百万优质题库,直接搜索题库名称,支持多种刷题模式:顺序练习、语音听题、本地搜题、顺序阅读、模拟考试、组卷考试、赶快下载吧! 2.彩虹搜题 这是个老公众号了 支持手写输入,截图搜题,详细步骤,解题必备

UnrealScriptIDE调试环境部署

先安装vs2010   再安装VSIsoShell.exe, 下载地址 https://pan.baidu.com/s/10kPNUuDGTbWXbz7Nos-1WA       fd3t   最后安装unside,下载地址 https://archive.codeplex.com/?p=uside  安装中间有一步选择Binary文件夹要选对路径。   安装好以后,启动 UDKDe

C/C++的编译和链接过程

目录 从源文件生成可执行文件(书中第2章) 1.Preprocessing预处理——预处理器cpp 2.Compilation编译——编译器cll ps:vs中优化选项设置 3.Assembly汇编——汇编器as ps:vs中汇编输出文件设置 4.Linking链接——链接器ld 符号 模块,库 链接过程——链接器 链接过程 1.简单链接的例子 2.链接过程 3.地址和