本文主要是介绍执行./nutch 命令后出现的nutch脚本用法解读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Usage: nutch COMMAND
where COMMAND is one of:inject inject new urls into the database :注入新的url到数据库中
hostinject creates or updates an existing host table from a text file :从一个文本文件中创建或更新现有主机表
generate generate new batches to fetch from crawl db: 生成新的批次从db爬取
fetch fetch URLs marked during generate:获取url标记中生成
updatedb update web table after parsing:解析后更新网络表
updatehostdb update host table after parsing:解析后更新主机表
readdb read/dump records from page database:从页面数据库中读取和转储记录
readhostdb display entries from the hostDB:从主机数据库中显示实体
elasticindex run the elasticsearch indexer:运行elasticsearch索引器
solrindex run the solr indexer on parsed batches:在解析批次时运行solr索引器
solrdedup remove duplicates from solr:从solr中移出多重记录(副本、去重!)
parsechecker check the parser for a given url:对于一个给定的url检查解析
indexchecker check the indexing filters for a given url:对于一个给定的过滤器,检查索引过滤器
plugin load a plugin and run one of its classes main():加载插件和运行它的主类
nutchserver run a (local) Nutch server on a user defined port:在用户定义端口上运行一个本地nutch服务器
junit runs the given JUnit test:运行一个给定的junit单元测试
or
CLASSNAME run the class named CLASSNAME:运行类命名的类名
Most commands print help when invoked w/o parameters:大多数命令在调用时打印帮助参数。
cat nutch|wc -l:此行命令的作用是:统计nutch脚本的行数,结果是244行
这篇关于执行./nutch 命令后出现的nutch脚本用法解读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!