本文主要是介绍scrapy 设置爬取深度 (七),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
通过在settings.py中设置DEPTH_LIMIT的值可以限制爬取深度,这个深度是与start_urls中定义url的相对值。也就是相对url的深度。例如定义url为:http://www.domz.com/game/,DEPTH_LIMIT=1那么限制爬取的只能是此url下一级的网页。深度大于设置值的将被ignore。
如图:
这篇关于scrapy 设置爬取深度 (七)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!