执行./nutch 命令后出现的nutch脚本用法解读

2024-06-23 17:38

本文主要是介绍执行./nutch 命令后出现的nutch脚本用法解读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


Usage: nutch COMMAND  

where COMMAND is one of:  
inject        inject new urls into the database  :注入新的url到数据库中
hostinject    creates or updates an existing host table from a text file :从一个文本文件中创建或更新现有主机表
generate      generate new batches to fetch from crawl db: 生成新的批次从db爬取
fetch         fetch URLs marked during generate:获取url标记中生成
updatedb      update web table after parsing:解析后更新网络表
updatehostdb  update host table after parsing:解析后更新主机表
readdb        read/dump records from page database:从页面数据库中读取和转储记录
readhostdb    display entries from the hostDB:从主机数据库中显示实体
elasticindex  run the elasticsearch indexer:运行elasticsearch索引器
solrindex     run the solr indexer on parsed batches:在解析批次时运行solr索引器
solrdedup     remove duplicates from solr:从solr中移出多重记录(副本、去重!)
parsechecker  check the parser for a given url:对于一个给定的url检查解析
indexchecker  check the indexing filters for a given url:对于一个给定的过滤器,检查索引过滤器
plugin        load a plugin and run one of its classes main():加载插件和运行它的主类
nutchserver   run a (local) Nutch server on a user defined port:在用户定义端口上运行一个本地nutch服务器
junit         runs the given JUnit test:运行一个给定的junit单元测试
or
CLASSNAME     run the class named CLASSNAME:运行类命名的类名
Most commands print help when invoked w/o parameters:大多数命令在调用时打印帮助参数。

cat nutch|wc -l:此行命令的作用是:统计nutch脚本的行数,结果是244行

这篇关于执行./nutch 命令后出现的nutch脚本用法解读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1087831

相关文章

Linux使用nohup命令在后台运行脚本

《Linux使用nohup命令在后台运行脚本》在Linux或类Unix系统中,后台运行脚本是一项非常实用的技能,尤其适用于需要长时间运行的任务或服务,本文我们来看看如何使用nohup命令在后台... 目录nohup 命令简介基本用法输出重定向& 符号的作用后台进程的特点注意事项实际应用场景长时间运行的任务服

Redis的Hash类型及相关命令小结

《Redis的Hash类型及相关命令小结》edisHash是一种数据结构,用于存储字段和值的映射关系,本文就来介绍一下Redis的Hash类型及相关命令小结,具有一定的参考价值,感兴趣的可以了解一下... 目录HSETHGETHEXISTSHDELHKEYSHVALSHGETALLHMGETHLENHSET

Springboot中Jackson用法详解

《Springboot中Jackson用法详解》Springboot自带默认json解析Jackson,可以在不引入其他json解析包情况下,解析json字段,下面我们就来聊聊Springboot中J... 目录前言Jackson用法将对象解析为json字符串将json解析为对象将json文件转换为json

如何使用 Bash 脚本中的time命令来统计命令执行时间(中英双语)

《如何使用Bash脚本中的time命令来统计命令执行时间(中英双语)》本文介绍了如何在Bash脚本中使用`time`命令来测量命令执行时间,包括`real`、`user`和`sys`三个时间指标,... 使用 Bash 脚本中的 time 命令来统计命令执行时间在日常的开发和运维过程中,性能监控和优化是不

bat脚本启动git bash窗口,并执行命令方式

《bat脚本启动gitbash窗口,并执行命令方式》本文介绍了如何在Windows服务器上使用cmd启动jar包时出现乱码的问题,并提供了解决方法——使用GitBash窗口启动并设置编码,通过编写s... 目录一、简介二、使用说明2.1 start.BAT脚本2.2 参数说明2.3 效果总结一、简介某些情

C#如何优雅地取消进程的执行之Cancellation详解

《C#如何优雅地取消进程的执行之Cancellation详解》本文介绍了.NET框架中的取消协作模型,包括CancellationToken的使用、取消请求的发送和接收、以及如何处理取消事件... 目录概述与取消线程相关的类型代码举例操作取消vs对象取消监听并响应取消请求轮询监听通过回调注册进行监听使用Wa

PHP执行php.exe -v命令报错的解决方案

《PHP执行php.exe-v命令报错的解决方案》:本文主要介绍PHP执行php.exe-v命令报错的解决方案,文中通过图文讲解的非常详细,对大家的学习或工作有一定的帮助,需要的朋友可以参考下... 目录执行phpandroid.exe -v命令报错解决方案执行php.exe -v命令报错-PHP War

C#反射编程之GetConstructor()方法解读

《C#反射编程之GetConstructor()方法解读》C#中Type类的GetConstructor()方法用于获取指定类型的构造函数,该方法有多个重载版本,可以根据不同的参数获取不同特性的构造函... 目录C# GetConstructor()方法有4个重载以GetConstructor(Type[]

Oracle数据库执行计划的查看与分析技巧

《Oracle数据库执行计划的查看与分析技巧》在Oracle数据库中,执行计划能够帮助我们深入了解SQL语句在数据库内部的执行细节,进而优化查询性能、提升系统效率,执行计划是Oracle数据库优化器为... 目录一、什么是执行计划二、查看执行计划的方法(一)使用 EXPLAIN PLAN 命令(二)通过 S

CentOS系统使用yum命令报错问题及解决

《CentOS系统使用yum命令报错问题及解决》文章主要讲述了在CentOS系统中使用yum命令时遇到的错误,并提供了个人解决方法,希望对大家有所帮助,并鼓励大家支持脚本之家... 目录Centos系统使用yum命令报错找到文件替换源文件为总结CentOS系统使用yum命令报错http://www.cppc