本文主要是介绍爬虫一:获取豆瓣图书Top250(Requests+XPath),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
目的:
获取豆瓣图书Top250的所有书目信息。
豆瓣网址:https://book.douban.com/top250
代码:
import requests
from lxml import etree
import timefor i in range(10):url = 'https://book.douban.com/top250?start=' + str(25*i)data = requests.get(url).texthtml = etree.HTML(data)books = html.xpath('//*[@id="content"]/div/div[1]/div/table')for book in
这篇关于爬虫一:获取豆瓣图书Top250(Requests+XPath)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!