学库专题

CNN识别学库bao的验证码

前言 背景 最近在看深度学习相关知识,正好手上一个爬虫外包有个需求:爬取 学库bao的全站数据。官方传言题目有一千多万道,其中每道题要查看答案和解析,都需要识别验证码(数字+字母,四个字符)。一般的,打码平台一块钱可以识别200张,算下来得要5万的打码费用,还没算失败率。图片示例              参考 本文参考了《CNN破解简单验证码(Tensorflow实现)》。网上一搜”验