本文主要是介绍爬虫——图书馆抢座,Python果然无所不能!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
python爬虫 -----图书馆抢座
本人也是一位考研学子 奈何图书馆座位总抢不到 就利用学过的技术做了一个图书馆抢座系统。
主要原理是利用提交post表单的形式进行抢座。
验证码识别
整个爬虫最难的可能就是验证码了,小编自然也走过很多歪路,有用过pytesseract识别,这pytesseract是真的垃圾,正确率不可直视 后来采用腾讯的一个接口进行测试 接口测试自然是可行的 奈何也得花个7-8秒 还不如手抢 在一次偶然的机会 通过文献、百度终于找到了大哥muggle_ocr 这个大哥可是拯救我于水火之中啊 0.3秒识别 废话不多说了代码粘上
#file_name是验证码图片路径 with open(file_name, "rb") as f:captcha_bytes = f.read()text = sdk.predict(image_bytes=captcha_bytes) 1234
分析登录请求信息
实质还是以post的形式提交表单。通过fiddler抓包得到,提交的信息和请求头如下:
用户登录获取请求信息尤其是cookie
登录有一个重点就是利用session域保存一整个会话,为方便之后的获取验证码,以及抢座做准备。然后进行简单登录吧代码如下:
def login(self,username,password,qu
这篇关于爬虫——图书馆抢座,Python果然无所不能!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!