python 百度原图爬虫高清图 ~按分辨率爬取，解析简单加密。

本文主要是介绍python 百度原图爬虫高清图 ~按分辨率爬取，解析简单加密。，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

前几天被公司临时安排了一个爬取百度图片的人物。我一开始以为很简单。后来发现只要分辨率大于500*438左右就是缩略图。导致了我经历了很多的坑。下面带你们感受下从坑到填满坑。

百度图片百度图片

因为我要按照分辨来进行爬取，所以先自定义好分辨率 在这里插入图片描述
先给大家排个坑，这个页面是什么看不到什么数据的，所以要去其他页面。点击图片进入下一个页面！

第一个坑~
因为当时我想方便一点。就想直接用这个下载的url,因为python的requests可以直接用下载的链接也可以直接下载下来。
但是！！
这个页面是js加载的，requests这个页面没办法出来这个下载的按钮的数据参数。当然可以使用selenium 自动化是可以做到的。但是对于大量爬虫不现实。 这个方法pass掉

第二个坑
会点爬虫的都会找到这个页面的json数据
在这里插入图片描述

写爬虫访问这个页面有2个方法，1.可以用url拼接(format参数)

page_url = url.format(urllib.parse.quote(word), num * page_num,width,height) #这样拼接参数

2.或者使用 response = requests.get(detail_url, params=params)

params = {"word": word,"di": item['di'],"tn": "baiduimagedetail","cs": item['cs'],"os": item['os'],}detail_url = "http://image.baidu.com/search/detail"response = requests.get(detail_url, params=params)