本文主要是介绍Nutch+ElasticSearch/Solr+Hadoop,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
方案:Nutch+ElasticSearch/Solr+Hadoop
Nutch:爬取网页
ES/Solr:构建索引库,提供搜索服务,Restful API支持
Hadoop:hdfs用于存储索引文件,关于存储也可以考虑NoSql,如:cassandra,hbase
这篇关于Nutch+ElasticSearch/Solr+Hadoop的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!